Anthropic merilis Claude 3.5 Sonnet dan Haiku, memperluas AI

Anthropic telah meluncurkan dua model AI canggih, Claude 3.5 Sonnet dan Claude 3.5 Haiku , dengan peningkatan signifikan dalam fungsionalitas dan kinerja, terutama dalam pengkodean. Claude 3.5 Sonnet yang ditingkatkan mengungguli pendahulunya dalam beberapa tolok ukur, kata perusahaan itu, sementara Claude 3.5 Haiku menyamai kecerdasan model terbesar Anthropic sebelumnya, Claude 3 Opus, dengan biaya dan kecepatan yang sama.

Claude 3.5 Sonnet menghadirkan peningkatan penting dalam pengkodean. Skor SWE-bench Verified-nya meningkat menjadi 49,0%, mengungguli model lain yang tersedia untuk umum dan sistem khusus. Model ini juga maju dalam TAU-bench, tugas penggunaan alat agensi, yang menunjukkan peningkatan dalam domain ritel dan maskapai penerbangan.

GitLab , platform berbasis web yang membantu tim berkolaborasi dalam pengembangan perangkat lunak, menguji model untuk tugas DevSecOps dan menemukannya memberikan penalaran yang lebih kuat (hingga 10% di seluruh kasus penggunaan) tanpa latensi tambahan, menjadikannya pilihan ideal untuk mendukung proses pengembangan perangkat lunak multi-langkah.

Pengumuman peluncuran tersebut menyertakan pernyataan dukungan dari klien utama, termasuk Cognition dan The Browser Company , yang menyoroti peningkatan model dalam hal pengodean, perencanaan, dan otomatisasi. “Claude 3.5 Sonnet telah mengungguli setiap model yang telah kami uji dalam mengotomatiskan alur kerja berbasis web,” kata juru bicara Browser Company.

Claude 3.5 Haiku, model cepat generasi berikutnya dari Anthropic, menawarkan peningkatan kinerja yang luas dengan biaya dan kecepatan yang sama seperti Claude 3 Haiku sebelumnya. Dengan skor 40,6% pada SWE-bench Verified, model ini melampaui model lama, sehingga cocok untuk produk yang berhadapan dengan pengguna dan tugas yang memerlukan personalisasi, seperti menganalisis riwayat pembelian atau mengelola catatan inventaris. Claude 3.5 Haiku akan diluncurkan akhir bulan ini pada API Anthropic, Amazon Bedrock, dan Vertex AI milik Google Cloud.