OpenAI luncurkan GPT-4.1 lebih jago ngoding, tapi berbayar Trending topik

cover | @openai

OpenAI resmi meluncurkan serangkaian model baru, GPT-4.1, GPT-4.1 mini dan GPT-4.1 nano, yang menunjukkan peningkatan dibandingkan versi sebelumnya, khususnya dalam hal pengodean, mengikuti instruksi, dan pemahaman konteks yang panjang.

"Kami meluncurkan tiga model baru dalam API: GPT‑4.1, GPT‑4.1 mini, dan GPT‑4.1 nano. Model-model ini mengungguli GPT‑4o dan GPT‑4o mini secara keseluruhan, dengan peningkatan besar dalam pengodean dan instruksi yang mengikutinya," tulis OpenAI dalam pengumuman resminya, dikutip topik.id Selasa (15/4/2025).

Model-model ini mendukung hingga 1 juta token konteks dan memiliki batas pengetahuan Juni 2024.

"Model-model ini juga memiliki jendela konteks yang lebih besar—mendukung hingga 1 juta token konteks—dan mampu menggunakan konteks tersebut dengan lebih baik dengan pemahaman konteks panjang yang lebih baik. Model-model ini memiliki batas pengetahuan yang diperbarui pada bulan Juni 2024," jelasnya.

Peningkatan kinerja.

Pengodean : GPT-4.1 mencapai 54,6% pada tolok ukur SWE-bench Verified, melampaui GPT-4o sebesar 21,4% dan GPT-4.5 sebesar 26,6% . Ia unggul dalam menyelesaikan tugas pengodean, membuat lebih sedikit suntingan yang tidak perlu, dan mengikuti format diff dengan andal.

Instruksi Berikut : Mendapatkan skor 38,3% pada tolok ukur MultiChallenge Scale, peningkatan 10,5% dibandingkan GPT-4o, yang menunjukkan peningkatan kemampuan untuk mengikuti instruksi yang rumit.

Konteks Panjang : Dalam tolok ukur Video-MME, GPT-4.1 memperoleh skor 72,0%, meningkat 6,7% dibandingkan GPT-40, yang menunjukkan kemampuannya untuk memahami dan memanfaatkan konteks panjang secara efektif.

Varian model.

GPT-4.1 mini secara signifikan mengurangi latensi hingga hampir setengahnya dan biaya hingga 83% , sembari tetap mengungguli GPT-4o dalam banyak benchmark.

GPT-4.1 nano adalah model tercepat dan paling hemat biaya, ideal untuk tugas yang membutuhkan latensi rendah, mencapai 80,1% pada MMLU dan 50,3% pada GPQA.

Aplikasi di dunia nyata.

Pengembang telah melaporkan bahwa model GPT-4.1 lebih efektif untuk aplikasi dunia nyata, termasuk:

Selancar Angin : Mencatat peningkatan performa sebesar 60% pada tolok ukur pengkodean.

Qodo : Menemukan GPT-4.1 menghasilkan saran tinjauan kode yang lebih baik dalam 55% kasus.

Blue J : Mencapai akurasi 53% lebih tinggi dalam evaluasi skenario pajak.

Thomson Reuters : Peningkatan akurasi peninjauan multi-dokumen sebesar 17%.

Kemampuan konteks panjang.

Kemampuan untuk memproses 1 juta token memungkinkan GPT-4.1 untuk menangani berbagai dokumen dan tugas kompleks di berbagai domain, seperti aplikasi hukum dan pengkodean.

Kinerjanya telah meningkat dalam mengambil informasi relevan dari konteks yang besar dan menghilangkan ambiguitas di antara berbagai permintaan.

Kinerja multimoda.

Model GPT-4.1 unggul dalam pemahaman gambar dan tugas multimoda, mencapai hasil terkini dalam tolok ukur seperti Video-MME, yang memperoleh skor 72,0%.

Harga.

Seri GPT-4.1 kini tersedia, dengan GPT-4.1 yang 26% lebih murah daripada GPT-4o untuk kueri median. Model nano GPT-4.1 adalah opsi yang paling terjangkau dan tercepat, dengan diskon yang lebih besar untuk kueri konteks berulang.

Seri GPT-4.1 menunjukkan kemajuan signifikan dalam kemampuan AI, dengan fokus pada utilitas dunia nyata dan peningkatan kinerja di berbagai aplikasi.

OpenAI luncurkan GPT-4.1 lebih jago ngoding, tapi berbayar

Top

Populer