OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh

Openai Tung Hang Loat Mo Hinh Ai Moi Voi Kha Nang Ly Luan Manh Nhat Hien Nay Khong Chi Doc Hieu Ma Con Suy Nghi Bang Hinh Anh

OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh

Ngoài ra, Microsoft Copilot Vision vừa chính thức miễn phí trên Edge: AI “nhìn” được màn hình, hỗ trợ mọi tác vụ OpenAI vừa chính thức công bố hai mô hình trí tuệ nhân tạo mới mang tên o3 và o4-mini, đánh dấu bước tiến quan trọng trong nỗ lực phát triển các hệ thống AI có khả năng suy luận vượt trội. Microsoft vừa công bố tính năng Copilot Vision nay đã hoàn toàn miễn phí cho tất cả người dùng trình duyệt Edge. Với khả năng hiểu và phản hồi nội dung trên web theo thời gian thực, Copilot Vision hứa hẹn sẽ là trợ lý AI đắc lực trong quá trình duyệt web, tra cứu, mua sắm và học tập. Trong bản tin hôm nay, bạn sẽ khám phá:

  • OpenAItung hàng loạt mô hình AI mớivới khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh
  • Microsoft Copilot Vision vừachính thức miễn phí AI“nhìn” được màn hình, hỗ trợ mọi tác vụ
  • Netflix thử nghiệmcông cụ tìm kiếm AI mới, do OpenAI cung cấp

OPENAI

OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình Vừa qua, OpenAI vừa công bố hai mô hình trí tuệ nhân tạo mới mang têno3o4-mini, đánh dấu bước tiến lớn trong khả năng suy luận đa phương thức của hệ thống AI. Cả hai đều được thiết kế với khả năng suy luận vượt trội, tích hợp hình ảnh và công cụ thông minh, hai mô hình này hứa hẹn sẽ thay đổi cách chúng ta giải quyết các vấn đề phức tạp trong lập trình, khoa học, toán học và hơn thế nữa.

OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh

Nguồn: The AI Growth

OpenAI mô tả o3 là mô hình suy luận tiên tiến nhất từ trước đến nay của họ. Nó vượt trội so với các mô hình trước đó trong các bài kiểm tra về toán học, lập trình, suy luận, khoa học và nhận thức trực quan. Trong khi đó, o4-mini mang lại sự cân bằng cạnh tranh giữa giá cả, tốc độ và hiệu suất, những yếu tố quan trọng đối với nhà phát triển khi lựa chọn mô hình AI cho ứng dụng của họ. Khác với các mô hình trước, o3 và o4-mini có thể sử dụng các công cụ của ChatGPT như duyệt web, thực thi mã Python, xử lý và tạo ảnh để hỗ trợ việc tạo phản hồi. Từ hôm nay, cả hai mô hình này, cùng với biến thể o4-mini-high (được tối ưu hóa để tạo câu trả lời đáng tin cậy hơn), đã có sẵn cho người dùng đăng ký các gói Pro, Plus và Team của OpenAI. Mô hình o3 và o4-mini là gì? o3: Mô hình suy luận tiên tiến nhất

  • o3là mô hình AI mạnh mẽ nhất của OpenAI tính đến nay, được thiết kế để xử lý các tác vụ phức tạp như lập trình, toán học, khoa học và nhận thức thị giác.
  • Sử dụng kỹ thuật“chuỗi suy nghĩ riêng tư” (private chain of thought), o3 tự động lập kế hoạch và suy luận từng bước trước khi đưa ra câu trả lời, mang lại kết quả chính xác và đáng tin cậy hơn.
  • Hiệu suất vượt trội: o3 đạt87.7% trên GPQA Diamond(câu hỏi khoa học cấp chuyên gia),71.7% trên SWE-bench Verified(giải quyết vấn đề lập trình), vàElo 2727 trên Codeforces(so với 1891 của o1).

o4-mini: Nhanh, rẻ, hiệu quả

  • o4-minilà phiên bản nhỏ hơn, tối ưu hóa về tốc độ và chi phí, nhưng vẫn duy trì hiệu suất ấn tượng trong các lĩnh vực STEM (khoa học, công nghệ, kỹ thuật, toán học).
  • Phù hợp cho các ứng dụng cần cân bằng giữa hiệu năng và chi phí, o4-mini đạt68.1% trên SWE-bench, gần tương đương với o3.
  • Chi phí thấp:1.10 USD/triệu token đầu vào4.40 USD/triệu token đầu ra, rẻ hơn 63% so với các mô hình trước như o1-mini.

Các tính năng nổi bật của 2 mô hình o3 và o4-mini Suy luận với hình ảnh

  • Lần đầu tiên, OpenAI tích hợp khả năng“suy nghĩ với hình ảnh”, cho phép o3 và o4-mini phân tích và suy luận dựa trên các hình ảnh như bản phác thảo, biểu đồ, hoặc tài liệu chất lượng thấp.
  • Ví dụ: o3 có thể đọc một poster nghiên cứu khoa học, duyệt web để bổ sung thông tin, và đưa ra kết luận chi tiết, ngay cả khi thông tin không có trong hình ảnh ban đầu.

OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh Nguồn: Công Nghệ Việt Tích hợp công cụ thông minh

  • Cả hai mô hình đều có khả năng tự động sử dụng các công cụ như:
    • Duyệt webđể tìm kiếm thông tin bổ sung.
    • Thực thi mã Pythonđể giải quyết các bài toán lập trình.
    • Tạo hình ảnhđể hỗ trợ trực quan hóa dữ liệu.
  • Tính năng này giúp o3 và o4-mini tiến gần hơn đếnagentic AI(AI tự hành), có khả năng tự lập kế hoạch và thực hiện các tác vụ phức tạp mà không cần hướng dẫn chi tiết.

Hiệu suất vượt trội

  • So vớio1(mô hình suy luận trước đó), o3 cải thiện đáng kể:
    • ARC-AGI: o3 đạt độ chính xác gấp ba lần o1 (87.5% so với 32%).
    • Lỗi nghiêm trọng: Giảm 20% trong các tác vụ thực tế.
  • o4-mini, dù nhỏ hơn, vẫn mang lại hiệu suất gần tương đương o3 trong các tác vụ STEM, nhưng với tốc độ nhanh hơn và chi phí thấp hơn.

Việc ra mắt các mô hình mới này nằm trong nỗ lực cạnh tranh của OpenAI với các đối thủ như Google, Meta, xAI, Anthropic và DeepSeek trên thị trường AI toàn cầu. Trong vài tuần tới, OpenAI dự kiến phát hành o3-pro, phiên bản o3 mạnh mẽ hơn dành riêng cho người đăng ký ChatGPT Pro. CEO Sam Altman cho rằng, o3 và o4-mini có thể là những mô hình suy luận AI độc lập cuối cùng của OpenAI trong ChatGPT trước khi GPT-5 ra mắt, một mô hình được kỳ vọng sẽ thống nhất các mô hình truyền thống (như GPT-4.1) với các mô hình suy luận hiện tại của họ.

COPILOT

Microsoft Copilot Vision vừa chính thức miễn phí AI “nhìn” được màn hình, hỗ trợ mọi tác vụ Mustafa Suleyman, CEO của Microsoft AI, vừa công bố trên Bluesky rằng Copilot Vision, tính năng trợ lý AI của Microsoft có khả năng diễn giải nội dung trên màn hình và hỗ trợ người dùng tương tác với các ứng dụng, hiện đã được cung cấp miễn phí trong trình duyệt Edge. Microsoft mô tả Vision là một “trải nghiệm dựa trên giọng nói”, đây là trải nghiệm “trao đổi bằng lời nói”, cho phép dùng giọng nói tương tác với Copilot. OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh

Nguồn: Microsoft

Người dùng cần chủ động “bật”/opt-in để Copilot Vision hoạt động, lúc này AI sẽ “thấy những gì bạn thấy trên màn hình”. Suleyman gợi ý người dùng có thể nhờ Copilot Vision hướng dẫn các bước trong một công thức nấu ăn trong khi đang thực hiện, hoặc yêu cầu nó “giải mã” các mô tả công việc để “nhảy thẳng vào việc chuẩn bị phỏng vấn tùy chỉnh hoặc lên ý tưởng cho thư xin việc”. (Mặc dù việc sử dụng AI cho sơ yếu lý lịch có thể không phải là ý tưởng tốt nhất). Theo trang hỗ trợ của Microsoft, “Copilot Vision có thể đánh dấu các phần trên màn hình để giúp bạn tìm thông tin liên quan”, tuy nhiên không thực hiện các thao tác trực tiếp như click link thay cho người dùng. Theo Microsoft, Copilot Vision sẽ đánh dấu các khu vực liên quan trên màn hình để giúp dễ tìm thông tin hơn. Các tính năng Copilot Vision rộng hơn, trên toàn hệ thống, vẫn chỉ dành cho người đăng ký Copilot Pro. Với gói thuê bao, Vision mở rộng khả năng vượt ra ngoài Edge, cho phép bạn yêu cầu nó hỗ trợ sử dụng các tính năng trong Photoshop hoặc phần mềm chỉnh sửa video, hoặc hướng dẫn bạn chơi một trò chơi như Minecraft, như Tom Warren của The Verge đã trải nghiệm vào đầu tháng này. Để dùng thử Copilot Vision, hãy mở liên kết đến trang web của Microsoft trong trình duyệt Edge. Thao tác này sẽ hiển thị lời nhắc để bạn chấp nhận bật tính năng. Sau khi cấp quyền, bạn có thể mở thanh bên Copilot khi đang ở trên một trang web, nhấp vào biểu tượng micro và phiên Vision của bạn sẽ bắt đầu, được báo hiệu bằng một tiếng chuông và màu sắc trình duyệt thay đổi. Theo Microsoft, công ty lưu nhật ký các phản hồi của Copilot cho người dùng nhưng không thu thập dữ liệu đầu vào, hình ảnh hoặc nội dung trang khi đang trong phiên Copilot Vision. Khi bạn muốn ngừng chia sẻ màn hình với Copilot, bạn có thể kết thúc phiên hoặc đóng cửa sổ trình duyệt.

NETFLIX

Netflix thử nghiệm công cụ tìm kiếm AI mới, do OpenAI cung cấp Theo báo cáo từ Bloomberg, Netflix vừa triển khai thử nghiệm một công cụ tìm kiếm AI mới cho một số người dùng nhất định. Công cụ này, được hỗ trợ bởi OpenAI (nhà phát triển ChatGPT), hứa hẹn sẽ nâng cao khả năng tìm kiếm của Netflix, vượt xa việc tìm kiếm phim và chương trình truyền hình theo tiêu đề, thể loại hoặc diễn viên.

OpenAI tung hàng loạt mô hình AI mới với khả năng “lý luận” mạnh nhất hiện nay, không chỉ đọc hiểu mà còn suy nghĩ bằng hình ảnh

Nguồn: The AI Growth

Điểm đặc biệt của công cụ tìm kiếm AI này là khả năng cho phép người dùng tìm kiếm nội dung dựa trên nhiều truy vấn khác nhau, bao gồm cả tâm trạng. Ví dụ, người dùng có thể tìm kiếm “phim hài lãng mạn nhẹ nhàng” hoặc “phim kinh dị hồi hộp”. Do được hỗ trợ bởi OpenAI, người dùng có thể sử dụng ngôn ngữ tự nhiên trong các truy vấn tìm kiếm của mình, giúp việc tìm kiếm trở nên trực quan và dễ dàng hơn. Hiện tại, công cụ tìm kiếm AI đang trong giai đoạn thử nghiệm giới hạn. Nó chỉ khả dụng trên thiết bị iOS và cho một số khách hàng ở Úc và New Zealand. Ngoài ra, người dùng phải chủ động chọn tham gia để sử dụng công cụ này. Netflix dự kiến sẽ mở rộng thử nghiệm sang các quốc gia khác, bao gồm cả Hoa Kỳ, trong tương lai gần. Việc Netflix thử nghiệm công cụ tìm kiếm AI mở ra tiềm năng lớn cho việc khám phá nội dung mới và nâng cao trải nghiệm người dùng. Tuy nhiên, công ty cũng cần phải giải quyết những thách thức liên quan đến việc bảo vệ sự sáng tạo của con người và đảm bảo tính minh bạch trong việc sử dụng AI. Việc công cụ này được triển khai rộng rãi có thể ảnh hưởng đến cách người dùng tương tác với nền tảng, và có thể cung cấp thêm ý tưởng cho các tập phim của Black Mirror. Hy vọng email này đã mang lại cho bạn những tin tức thật thú vị và hữu ích về hoạt động vận hành của xu thế bùng nổ AI hiện tại! Và nếu bạn muốn tiếp tục cập nhật và đào sâu kiến thức AI cho bản thân hoặc đội ngũ của mình, đừng bỏ lỡ các khóa học AI chuyên sâu và tài nguyên mà The AI Growth (TAG) đang cung cấp. Cơ hội để bạn dẫn đầu xu hướng AI ngay hôm nay!