Operator | @openai |
Perusahaan yang dipimpin Sam Altman itu mengungkapan Operator dapat berinteraksi dengan halaman web dengan mengetik, mengeklik, dan menggulir, yang memungkinkannya mengelola tugas berulang seperti mengisi formulir, memesan bahan makanan, dan membuat meme. Kemampuan ini bertujuan untuk menghemat waktu bagi pengguna dan meningkatkan peluang keterlibatan bisnis.
"Hari ini kami merilis Operator (terbuka di jendela baru), agen yang dapat mengakses web untuk melakukan tugas bagi Anda. Dengan menggunakan perambannya sendiri, agen tersebut dapat melihat halaman web dan berinteraksi dengannya dengan mengetik, mengeklik, dan menggulir. Saat ini, agen tersebut masih dalam tahap pratinjau penelitian , yang berarti agen tersebut memiliki keterbatasan dan akan berkembang berdasarkan masukan pengguna," tulis OpenAI di laman resminya, dikutip Jumat (24/1/2025).
OpenAI juga mengungkapkan didukung oleh model Computer-Using Agent (CUA), Operator menggabungkan kemampuan penglihatan GPT-4o dengan penalaran tingkat lanjut melalui pembelajaran penguatan. Operator dapat "melihat" melalui tangkapan layar dan "berinteraksi" dengan antarmuka pengguna grafis (GUI) tanpa memerlukan integrasi API khusus. Jika menemui kesulitan, Operator dapat mengoreksi sendiri atau meminta intervensi pengguna, memastikan pengalaman kolaboratif.
"Operator adalah salah satu agen pertama kami, yang merupakan AI yang mampu melakukan pekerjaan bagi Anda secara mandiri—Anda memberinya tugas dan agen tersebut akan menjalankannya," jelasnya.
Pengguna dapat memulai tugas dengan mendeskripsikannya, dan Operator dapat menangani beberapa tugas secara bersamaan. Fitur personalisasi memungkinkan pengguna untuk mengatur instruksi khusus untuk situs web tertentu, sehingga meningkatkan efisiensi alur kerja. Kolaborasi dengan perusahaan seperti DoorDash dan Instacart bertujuan untuk memenuhi kebutuhan dunia nyata sekaligus meningkatkan aksesibilitas dalam aplikasi sektor publik.
Keamanan dan privasi.
OpenAI merincikan Operator mengutamakan keselamatan dengan beberapa tindakan pengamanan, termasuk:
- Mode Pengambilalihan : Meminta pengguna untuk mengambil alih kendali saat informasi sensitif terlibat.
- Konfirmasi Pengguna : Memerlukan persetujuan sebelum tindakan yang signifikan.
- Batasan Tugas : Menolak tugas sensitif seperti transaksi perbankan.
- Mode Pengawasan : Memerlukan pengawasan pada situs sensitif.
Privasi data dikelola melalui opsi untuk memilih keluar dari pelatihan model, menghapus data penelusuran, dan memantau perilaku mencurigakan. Operator dirancang untuk menolak permintaan yang merugikan dan memiliki sistem moderasi untuk mengatasi penyalahgunaan.
Keterbatasan dan pengembangan.
Sebagai pratinjau penelitian, Operator masih berkembang dan mungkin kesulitan dengan tugas-tugas rumit seperti mengelola kalender. Umpan balik pengguna akan sangat penting untuk meningkatkan kemampuannya.
encana masa depan termasuk mengekspos CUA dalam API untuk pengembang, meningkatkan kemampuan Operator untuk menangani alur kerja yang rumit, dan memperluas akses ke pengguna Plus, Team, dan Enterprise setelah keamanan dan kegunaannya dipastikan.
"Untuk memastikan peluncuran yang aman dan berulang, kami memulai dari yang kecil. Mulai hari ini, Operator tersedia untuk pengguna Pro di AS di operator.chatgpt.com (terbuka di jendela baru). Pratinjau penelitian ini memungkinkan kami untuk belajar dari para pengguna dan ekosistem yang lebih luas, menyempurnakan dan meningkatkannya seiring berjalannya waktu. Rencana kami adalah untuk memperluas ke pengguna Plus, Team, dan Enterprise dan mengintegrasikan kemampuan ini ke dalam ChatGPT di masa mendatang," terangnya.