Anthropic merilis Claude 3.5 Sonnet dan Haiku, memperluas AI

Anthropic telah meluncurkan dua model AI canggih, Claude 3.5 Sonnet dan Claude 3.5 Haiku , dengan peningkatan signifikan dalam fungsionalitas dan kinerja, terutama dalam pengkodean. Claude 3.5 Sonnet yang ditingkatkan mengungguli pendahulunya dalam beberapa tolok ukur, kata perusahaan itu, sementara Claude 3.5 Haiku menyamai kecerdasan model terbesar Anthropic sebelumnya, Claude 3 Opus, dengan biaya dan kecepatan yang sama.

Claude 3.5 Sonnet menghadirkan peningkatan penting dalam pengkodean. Skor SWE-bench Verified-nya meningkat menjadi 49,0%, mengungguli model lain yang tersedia untuk umum dan sistem khusus. Model ini juga maju dalam TAU-bench, tugas penggunaan alat agensi, yang menunjukkan peningkatan dalam domain ritel dan maskapai penerbangan.

GitLab , platform berbasis web yang membantu tim berkolaborasi dalam pengembangan perangkat lunak, menguji model untuk tugas DevSecOps dan menemukannya memberikan penalaran yang lebih kuat (hingga 10% di seluruh kasus penggunaan) tanpa latensi tambahan, menjadikannya pilihan ideal untuk mendukung proses pengembangan perangkat lunak multi-langkah.

Pengumuman peluncuran tersebut menyertakan pernyataan dukungan dari klien utama, termasuk Cognition dan The Browser Company , yang menyoroti peningkatan model dalam hal pengodean, perencanaan, dan otomatisasi. “Claude 3.5 Sonnet telah mengungguli setiap model yang telah kami uji dalam mengotomatiskan alur kerja berbasis web,” kata juru bicara Browser Company.

Claude 3.5 Haiku, model cepat generasi berikutnya dari Anthropic, menawarkan peningkatan kinerja yang luas dengan biaya dan kecepatan yang sama seperti Claude 3 Haiku sebelumnya. Dengan skor 40,6% pada SWE-bench Verified, model ini melampaui model lama, sehingga cocok untuk produk yang berhadapan dengan pengguna dan tugas yang memerlukan personalisasi, seperti menganalisis riwayat pembelian atau mengelola catatan inventaris. Claude 3.5 Haiku akan diluncurkan akhir bulan ini pada API Anthropic, Amazon Bedrock, dan Vertex AI milik Google Cloud.

Related Posts

Maraknya Deepfake Berbagai Rekayasa Sosial Berbasis AI

Deepfake merupakan masalah yang semakin meningkat bagi organisasi mana pun yang terhubung ke internet. Deepfake dapat menjadi sangat berbahaya ketika digunakan sebagai senjata oleh negara-negara dan penjahat siber. “Ketika orang…

Produk Teknologi Terbaik Tahun 2025 Pilihan Rob Enderle

Tahun ini penuh dengan perubahan besar, inovasi luar biasa, dan banyak sekali masalah. Jika kita menengok ke belakang pada tahun 2025, jelas bahwa industri teknologi akhirnya telah melampaui siklus “hype…

Leave a Reply

Your email address will not be published. Required fields are marked *

You Missed

Maraknya Deepfake Berbagai Rekayasa Sosial Berbasis AI

Maraknya Deepfake Berbagai Rekayasa Sosial Berbasis AI

Produk Teknologi Terbaik Tahun 2025 Pilihan Rob Enderle

Produk Teknologi Terbaik Tahun 2025 Pilihan Rob Enderle

Gartner Merekomendasikan untuk Menghindari Browser AI

Gartner Merekomendasikan untuk Menghindari Browser AI

Valuasi startup AI mеnіngkаtkаn kеkhаwаtіrаn gеlеmbung

Valuasi startup AI mеnіngkаtkаn kеkhаwаtіrаn gеlеmbung

Pеruѕаhааn chip AI Cеrеbrаѕ mеngаjukаn penarikan

Pеruѕаhааn chip AI Cеrеbrаѕ mеngаjukаn penarikan

Kеlоmроk peretas mеngklаіm hаmріr 1 miliar catatan Salesforce  

Kеlоmроk peretas mеngklаіm hаmріr 1 miliar catatan Salesforce