Nenek di Alexa

(Untuk Marco Rottigni)
07/07/22

Secara pribadi saya terpesona oleh kecerdasan buatan, teknologi dan bagaimana hal itu secara bertahap tetapi tak terhindarkan merayap ke dalam kehidupan kita dengan cara yang meresap.

Dengan memperbaikinya, tentu saja, terkadang dengan cara yang sangat mengganggu seperti ... menghidupkan kembali emosi yang terkait dengan orang-orang yang sudah tidak ada lagi.

Dalam kasus ini, berpikir kritis itu penting: pemikiran itulah yang mengarahkan kita untuk mengevaluasi dampak ini, memutuskan apakah kita ingin menjadi bagian darinya, juga menimbang potensi aspek negatifnya. Ini menjelaskan daya tarik yang dimiliki teknologi pada saya, sebagai alasan untuk seringnya pencerahan dan momen katarsis.

Salah satu momen ini terjadi pada saya beberapa hari yang lalu, setelah acara ulang: MARS 2022. Sebuah kermesse tentang kecerdasan buatan di mana raksasa Amazon menggambarkan kepada dunia studi, eksperimen, dan inovasinya dalam hal pembelajaran mesin, otomatisasi, robotika, dan ruang… diterapkan pada bisnis saat ini dan masa depan.

Acara itu sendiri sangat menarik, penuh dengan ide dan provokasi, dengan banyak tamu terkenal, termasuk dari luar. Pidato para tamu ini, yang dikenal dalam jargon sebagai keynotes, juga tersedia online di YouTube untuk dikonsumsi berulang kali oleh publik.

Di hari kedua keynote tersedia di https://www.youtube.com/watch?v=22cb24-sGhg, tepatnya setelah satu jam dua menit dari awal, saya dikejutkan oleh sebuah bagian dari Rohit Prasad - kepala ilmuwan oleh Alexa AI.

Saya mengikuti kontekstualisasinya, dengan sangat siap: berbicara tentang empati antara manusia dan mesin sebagai perasaan yang mendasari membangun hubungan kepercayaan, dia berfokus pada fakta bahwa bagi banyak dari kita, keadaan darurat pandemi baru-baru ini berarti hilangnya orang yang dicintai.

Alexa - sering menjadi simbol kehadiran teknologi ini bahkan jika untuk percakapan sederhana - telah mengembangkan keterampilan dari waktu ke waktu yang membuat saya benar-benar terkejut: jelas bukan untuk menghilangkan rasa sakit dari kehilangan ini, tetapi cukup untuk menyediakan cara lebih lanjut untuk membuat ingatan orang perawatan yang lebih gigih.
Dalam hitungan detik, video berubah untuk menunjukkan seorang anak yang meminta Alexa agar neneknya yang telah meninggal membacakannya sebuah bagian dari Wizard of Oz, seperti yang dia lakukan saat dia masih hidup.

Alexa menjawab dengan "Oke" untuk permintaan tersebut, untuk segera beralih ke simulasi sempurna dari suara nenek tersayang, memberikan emosi yang tampak nyata kepada cucu teknologi.

Video itu kemudian kembali ke Rohit, yang segera menjelaskan dua hal yang sangat mengejutkan saya karena kekuatan inovatifnya: pertama, bahwa kemungkinan yang baru saja dilihat berasal dari perubahan perspektif dalam cara menganalisis suara; lebih khusus, memindahkan analisis dari masalah generasi pidato, yaitu produksi frase audio, ke pertanyaan konversi suara.

Hal kedua, terkait erat dengan yang pertama, menyangkut bagaimana perubahan perspektif ini memungkinkan reproduksi hanya dengan satu menit rekaman suara yang ada, dibandingkan dengan berjam-jam rekaman studio yang diperlukan oleh pendekatan sebelumnya !!!

(Rohit Prasad di pentas ulang: MARS 2022)

Tapi saya berbicara terlebih dahulu tentang perlunya berpikir kritis: melewati wow momensebenarnya, saya mulai merenungkan beberapa aspek.

Ada beberapa layanan online, di mana salah satu metode otentikasi terdiri tepat dalam mengucapkan kalimat untuk membuktikan bahwa Anda adalah orang yang Anda klaim: jelas bahwa dengan teknologi seperti itu, yang juga tersedia tidak hanya untuk Amazon, itu menjadi penting untuk mempercayakan kekuatan proses otentikasi ke mekanisme lain - tentu saja kurang dapat disimulasikan.

Otentikasi biometrik suara tentu saja merupakan teknologi muda, yang, bagaimanapun, telah mengalami popularitas yang cukup cepat karena kemudahan penggunaannya dan tidak adanya alat aksesori untuk dimiliki. Sebagian besar popularitas ini telah melihat layanan perbankan dan asuransi merangkulnya secara besar-besaran, meskipun belakangan ini dikombinasikan dengan mekanisme lain untuk meningkatkan kekuatan proses secara keseluruhan. Dalam sebuah artikel tahun 2020, kombinasi nada multi-frekuensi dari keypad telepon dihipotesiskan sebagai proses otentikasi yang kuat, dikombinasikan dengan frasa yang direkam dengan suara pelanggan yang harus direproduksi: tak perlu dikatakan bahwa inovasi yang dihadirkan oleh Amazon itu akan meniadakan kekuatan itu, menempatkan proses otentikasi pada risiko serangan peniruan identitas. Serangan di mana penyerang memiliki semua alat yang diperlukan untuk bertindak seolah-olah dia adalah korban terakhir, menipu entitas teknologi yang seharusnya mengesahkan identitas.

Proses berisiko lainnya adalah yang melibatkan pengendalian akses, fisik atau virtual, untuk bekerja karena alasan penetapan harga atau memeriksa jam kerja. Area lain di mana penyerang akan sangat difasilitasi oleh teknologi sintesis ucapan ini.

Refleksi kedua sedikit lebih emosional: seperti yang saya katakan di awal, saya menemukan kemungkinan ini benar-benar menarik dan inovatif; Saya menyadari, bagaimanapun, bahwa untuk orang yang berbeda ini mungkin belum menjadi sumber emosi positif, tetapi memperpanjang rasa sakit kehilangan orang yang dicintai dengan cara yang penting dan sulit ditanggung.

Nah, jika ada satu hal yang membedakan manusia dengan teknologi adalah kesadaran, yang darinya kehendak bebas berasal. Sejarah mengajarkan kita kesia-siaan menyangkal kemajuan, ilmu pengetahuan dan teknologi demi perasaan dan keyakinan pribadi - benar atau salah. Itu sebabnya saya hanya merekomendasikan agar orang-orang ini memilih. Memilih untuk mengabaikan kemungkinan yang ditawarkan oleh teknologi ini, sambil meninggalkan hak yang sama kepada manusia lainnya.