Alibaba ra mắt Qwen3.5-Omni cho trí tuệ nhân tạo đa phương thức thời gian thực

Qwen3.5-Omni có khả năng nhận dạng giọng nói đa ngôn ngữ với 113 ngôn ngữ và phương ngữ cũng như khả năng tạo giọng nói bằng 36 ngôn ngữ.

Nhóm Qwen của Alibaba đã phát hành Qwen3.5-Omni, một mô hình đa phương thức có thể nhận và tạo ra văn bản, hình ảnh, âm thanh và video, và công ty cho biết nó có sẵn thông qua API ngoại tuyến và API thời gian thực.

Mô hình này hỗ trợ cửa sổ ngữ cảnh 256K và có thể xử lý các đầu vào âm thanh và video dạng dài.

Alibaba cho biết mô hình này được huấn luyện trên dữ liệu đa phương thức, bao gồm hơn 100 triệu giờ âm thanh và video, và nó đã cải thiện khả năng nhận dạng giọng nói đa ngôn ngữ với 113 ngôn ngữ và phương ngữ cũng như khả năng tạo giọng nói bằng 36 ngôn ngữ.

Alibaba cũng tuyên bố có các tính năng thời gian thực mới như ngắt lời ngữ nghĩa, sao chép giọng nói và điều khiển bằng giọng nói, và kết quả kiểm tra hiệu năng cho thấy khả năng xử lý hình ảnh và âm thanh của thiết bị này ngang bằng với Google Gemini 3.1 Pro.

Tttcnca

Alibaba ra mắt Qwen3.5-Omni cho trí tuệ nhân tạo đa phương thức thời gian thực

Chau The Phong

HAGL thu lãi hơn 75%, Thanh Hóa phê duyệt đồ án quy hoạch đô thị...

Long Châu tăng trưởng 60%, Thanh Hóa thúc tiến độ dự án thủy điện 400...

TP.HCM kêu gọi đầu tư tăng trưởng xanh, Hải Phòng thu hồi đất để thực...

Nhập khẩu điện gia dụng Việt Nam giảm, Zing “góp” 164 triệu hồ sơ vào...

EDP đầu tư 500 triệu USD vào điện gió và điện mặt trời, VNG rút...

Hàng loạt công ty chứng khoán lãi đậm, TP.HCM tìm ý tưởng quy hoạch bán...

PGBank báo lỗ quý IV, Bách Hóa Xanh dự định bán cổ phần

Gần 44% nhà đầu tư crypto Việt Nam thua lỗ trong 2023, 62% DN tại...

Fujitsu và Fanuc hợp tác với Nvidia trong lĩnh vực robot trí tuệ nhân tạo

Nvidia sẽ cung cấp phần cứng và phần mềm trí tuệ nhân tạo cho Toyota

Balmain triển khai hệ thống PLM để tối ưu hóa hoạt động vòng đời sản phẩm

Samsung vượt mặt Apple trong quý II về kinh doanh điện thoại thông minh

Google cho biết số người dùng ứng dụng Gemini đã tăng gấp đôi tại Đông Nam Á

Các thương hiệu xa xỉ ưu tiên trí tuệ nhân tạo (AI)

Nhu cầu yếu trong quý 2 làm lu mờ triển vọng phục hồi ngành bán lẻ Thái Lan

Editor's Picks

Thuế Nhập Khẩu Du Thuyền Giảm 50% khi Hiệp định EVFTA bước vào giai đoạn 2

“Hộ chiếu vaccine” sẽ giúp chúng ta di chuyển quốc tế trở lại như thế nào?

CEO Eric Trần: “Niche nằm ở thái độ và giá trị mà bạn mang tới”

Most Popular

HAGL thu lãi hơn 75%, Thanh Hóa phê duyệt đồ án quy hoạch đô thị rộng hơn 5.100...

Triển vọng của thị trường bất động sản du lịch trong giai đoạn mới

Toàn cảnh thị trường bất động sản Việt Nam Q1/2025 có những điểm gì nổi bật?

Blockchain

Sam Bankman-Fried – Từ ‘thiên tài’ đến ‘kẻ lừa đảo’: 25 năm tù cho cú sập 11 tỷ...

Sự kiện halving “đẩy” 6.000 máy đào bitcoin cũ từ Hoa Kỳ sang châu Phi

Do Kwon bị dẫn độ về Hàn Quốc: Nhìn lại vụ sụp đổ lịch sử của đế chế...

Related posts