OpenAI ra mắt GPT-4 mini: Mô hình gọn nhẹ thay thế cho GPT-3.5

20/07/2024 11:22

Người dùng đã có thể sử dụng GPT-4 mini từ ngày hôm nay.

OpenAI vừa giới thiệu GPT-4o mini, mô hình trí tuệ nhân tạo (AI) nhỏ gọn mới nhất. OpenAI cho biết GPT-4o mini có giá thành rẻ hơn và hoạt động nhanh hơn các mô hình AI tiên tiến hiện tại, bắt đầu được cung cấp cho các nhà phát triển, người dùng thông qua ứng dụng web và di động ChatGPT, dự kiến đến tay người dùng doanh nghiệp vào tuần tới.

OpenAI ra mắt GPT-4 mini: Mô hình gọn nhẹ thay thế cho GPT-3.5- Ảnh 1.

Theo OpenAI, GPT-4o mini vượt trội so với các mô hình AI nhỏ hàng đầu hiện nay trong các tác vụ liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả về chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà nhà phát triển có thể yêu cầu mô hình AI thực hiện nhiều lần.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Theo OpenAI, GPT-4o mini đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng lý luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku (dữ liệu từ Artificial Analysis). Trên MGSM, công cụ đo lường khả năng toán học, GPT-4o mini đạt 87%, so với 78% của Flash và 72% của Haiku.

Ngoài ra, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm hơn đáng kể so với các mô hình tiên phong trước đó, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ xử lý văn bản và hình ảnh trong API, trong tương lai, OpenAI cho biết mô hình này sẽ hỗ trợ thêm khả năng xử lý video và âm thanh.

OpenAI ra mắt GPT-4 mini: Mô hình gọn nhẹ thay thế cho GPT-3.5- Ảnh 2.

"Để mọi ngóc ngách trên thế giới được AI hỗ trợ, chúng ta cần phải làm cho các mô hình trở nên dễ tiếp cận hơn nhiều", Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong cuộc phỏng vấn với TechCrunch. "Tôi nghĩ GPT-4o mini là một bước tiến thực sự lớn theo hướng đó".

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, tương đương với độ dài của một cuốn sách, và được cập nhật dữ liệu đến tháng 10/2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó tương đương với các mô hình AI nhỏ khác như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, dựa trên các bài kiểm tra trước khi ra mắt trên LMSYS.org, một nền tảng thi đấu chatbot, OpenAI tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

"So với các mô hình tương đương, GPT-4o mini hoạt động rất nhanh, với tốc độ xuất ra trung bình 202 token mỗi giây", George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. "Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, đây là lựa chọn hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng dành cho người tiêu dùng và các cách tiếp cận mới mẻ để sử dụng mô hình ngôn ngữ lớn (LLM)".