nilai datanya

(Untuk George Tosi)
16/02/22

Diketahui bahwa di Internet ada banyak data dari berbagai jenis dan sumber. Data yang umumnya tersedia untuk konsultasi melalui browser yang memungkinkan kita untuk berinteraksi dengan jaringan dengan cara yang hanya bisa tekstual (membaca artikel, misalnya) atau bahkan multimedia (audio, video dan streaming).

Oleh karena itu tampaknya semua data ini tersedia untuk siapa saja dan dapat digunakan untuk mengekstrak informasi yang dapat membantu kita memandu pilihan hidup kita sehari-hari.

Pada kenyataannya, hal-hal tidak begitu transparan dan sederhana. Metode penggunaan data ini sebenarnya dirancang untuk interaktivitas yang membedakan hubungan Manusia-Mesin. Kesulitan muncul ketika Anda ingin menggunakan kembali data ini untuk memprosesnya secara pribadi untuk mengekstrak informasi yang menarik bagi pengguna individu.

Untuk memperjelas, kami merujuk pada kasus harga saham dari pasar mana pun (Borsa Italiana, Nyse atau Nasdaq ...): ada banyak situs yang memungkinkan analisis kinerja saham (TICKER) dan memberikan keseluruhan serangkaian data terkait nilai, jumlah yang ditangani, maksimum dan minimum harian dan sebagainya. Antarmuka ke data ini, sebagaimana dinyatakan, adalah tipikal dari interaksi Manusia - Mesin: browser.

Jika saya ingin memproses data ini secara lokal untuk mengekstrak informasi yang menarik bagi saya, semuanya menjadi sangat rumit. Untuk mengakses data yang sama dari antarmuka terprogram, tersedia 2 metode: kerokan web atau akses melalui antarmuka data tertentu seperti API REST (representational state transfer) atau SOAP (Simple Object Access Protocol), di mana REST sejauh ini merupakan solusi yang paling luas dan digunakan.

Mari kita menganalisis secara singkat dua alternatif. Itu kerokan web didasarkan pada emulasi perilaku manusia dengan mentransfer halaman web yang menarik ke klien dan kemudian mengintervensinya untuk mencari data yang menarik dengan mengidentifikasi belt hold pengakuan yang diketahui. Misalnya, menggunakan tag HTML tertentu yang memungkinkan Anda mengidentifikasi data yang menarik dengan maksud halaman HTML.

Meskipun perpustakaan tersedia dalam berbagai bahasa pemrograman (JavaScript, Python, Java, ...) yang entah bagaimana memfasilitasi identifikasi dan pengenalan data tertentu, prosedurnya tidak langsung dan rentan terhadap kesalahan. Selanjutnya, jika halaman HTML sumber berubah, ada kemungkinan bahwa naskah dikembangkan salah karena belt hold pengenalan (misalnya tag yang mengidentifikasi data telah berubah) solusi ini, oleh karena itu, meskipun mungkin, dapat menjadi masalah karena kerumitan penerapan dan ketergantungan yang ketat pada struktur halaman HTML.

Solusi berdasarkan antarmuka terprogram API REST (atau SOAP) benar-benar lebih kuat dan lebih mudah diimplementasikan.

Tugas dari antarmuka ini adalah untuk menstandarisasi metode pengaksesan data. Dalam kasus antarmuka REST, teknologi HTTP akan digunakan dan data yang diminta akan dibaca melalui GET pada URL tertentu yang dibuat sedemikian rupa untuk mengidentifikasi data yang diinginkan secara unik.

Sebagai contoh, saya melaporkan URL untuk mengakses antarmuka REST dari layanan konversi mata uang yang disediakan oleh Bank of Italy.

https: //tassidicambio.bancaditalia.it/terzevalute-wf-web/rest/v1.0/dailyRates?referenceDate= {tanggal} & baseCurrencyIsoCode = {dari} cyIsoCode = {untuk} & lang = {“itu"}

Istilah yang dicetak tebal digunakan untuk menentukan mata uang yang terlibat dan tanggal penilaian rasio konversi. Operasi GET pada URL itu kemudian akan mengembalikan nilai yang dicari. Operasi ini dapat dengan mudah diimplementasikan dari bahasa pemrograman apa pun (Python, Javascript, C #,…) melalui penggunaan pustaka yang sesuai.

Meskipun ada banyak layanan gratis berdasarkan jenis antarmuka ini, menarik untuk dicatat bahwa ada banyak situs yang menawarkan informasi keuangan dengan biaya tertentu. Ini biasanya data yang sangat rinci yang menawarkan gambaran lengkap tentang aspek-aspek yang terkait dengan informasi keuangan yang berkaitan dengan pasar dan perusahaan di seluruh dunia. Saya ingin menggarisbawahi bahwa banyak dari situs ini, khususnya yang terkait dengan aspek ekonomi dan keuangan, menawarkan akses penuh hanya terhadap beberapa bentuk langganan.

Pada dasarnya, penggunaan data melalui antarmuka terprogram dikenakan pembayaran. Yang membantu memperkuat konsep dasar yang sering diabaikan: di Internet, nilai sebenarnya ada pada data. Jika data gabungan dan dapat digunakan, tetapi masih bersifat publik, dari perusahaan yang terdaftar memiliki nilai tertentu dan merupakan subjek dari penawaran berlangganan, kami dapat membayangkan nilai apa yang dimiliki data pribadi kami yang, kurang lebih secara sadar, telah kami kirimkan ke banyak perusahaan bahwa mereka mengelola situs e-commerce atau jejaring sosial.

Referensi

Salah satu dari banyak situs yang menawarkan informasi keuangan berbasis langganan https://site.financialmodelingprep.com/developer/docs/pricing

Memperdalam antarmuka REST https://www.ibm.com/cloud/learn/rest-apis