Google triển khai tính năng tạo video bằng AI trên nền tảng Gemini

Google chính thức bổ sung tính năng tạo video bằng AI vào chatbot Gemini, cho phép người dùng chuyển lời nhắc văn bản thành video ngắn bằng công nghệ Veo 2, mở rộng năng lực sáng tạo hình ảnh động trên nền tảng trí tuệ nhân tạo.

Google vừa công bố một bản cập nhật quan trọng cho nền tảng Gemini, bổ sung tính năng tạo video bằng AI thông qua mô hình Veo 2 do nhóm DeepMind phát triển. Tính năng này cho phép người dùng nhập lời nhắc bằng văn bản, sau đó hệ thống sẽ tạo ra một đoạn video động dài tối đa 8 giây, với độ phân giải 720p, định dạng MP4 và tỷ lệ khung hình tiêu chuẩn 16:9. Đây là một bước tiến lớn trong việc nâng cấp trải nghiệm sáng tạo nội dung bằng trí tuệ nhân tạo, đưa Gemini vượt ra khỏi phạm vi chatbot văn bản truyền thống.

Để sử dụng tính năng tạo video bằng AI, người dùng cần đăng ký gói Gemini Advanced. Sau khi đăng nhập, người dùng có thể chọn mô hình Veo 2 từ menu tạo nội dung, nhập mô tả ngắn gọn hoặc chi tiết về cảnh cần tạo, và nhận được video do AI dựng nên chỉ sau vài giây.

Hệ thống hiện đã triển khai cho người dùng trên toàn cầu, hỗ trợ đa ngôn ngữ và tương thích với cả trình duyệt web lẫn thiết bị di động. Tuy nhiên, để bảo toàn hiệu suất xử lý của GPU, Google cho biết họ sẽ áp dụng giới hạn về số lượng video mỗi người dùng có thể tạo trong một tháng.

Tính năng tạo video bằng AI được phát triển dựa trên công nghệ từng được Google sử dụng trong Dream Screen – một công cụ hỗ trợ sáng tạo video nền cho YouTube Shorts. Với Veo 2, người dùng không chỉ có thể tạo video từ lời nhắc mà còn có thêm tùy chọn thử nghiệm công cụ Whisk Animate, cho phép biến ảnh tĩnh thành video ngắn. Tính năng này đang được triển khai hạn chế cho những người dùng đăng ký gói Google One AI Premium.

Bên cạnh việc mở rộng năng lực sáng tạo, Google cũng đồng thời tăng cường tính minh bạch cho nội dung được tạo ra bởi trí tuệ nhân tạo. Tất cả các video do Veo 2 tạo ra sẽ được gắn hình mờ kỹ thuật số bằng công nghệ SynthID.

Đây là một định danh nhúng vào từng khung hình của video, giúp các nền tảng phân phối nội dung như YouTube Shorts hay TikTok dễ dàng nhận diện và phân loại các sản phẩm do AI tạo ra. Đây được xem là nỗ lực nhằm ngăn chặn tình trạng lan truyền thông tin giả mạo và tăng cường niềm tin của người dùng đối với nội dung được tạo bởi trí tuệ nhân tạo.

Trong khi các chatbot AI truyền thống như Gemini được biết đến chủ yếu với khả năng xử lý văn bản và dữ liệu ngôn ngữ tự nhiên, bản cập nhật với tính năng tạo video bằng AI cho thấy Google đang từng bước mở rộng các tính năng đa phương tiện, hướng tới một hệ sinh thái AI toàn diện hơn.

Trước đó, Google cũng đã hợp tác với các đối tác trong một dự án gây chú ý: tái hiện một bộ phim điện ảnh cổ điển từ năm 1939 bằng công nghệ Veo, trình chiếu trên màn hình LED khổng lồ tại Las Vegas Sphere. Đây được xem là màn trình diễn ấn tượng về khả năng kết hợp giữa AI sáng tạo hình ảnh và các định dạng trình chiếu quy mô lớn.

Sự xuất hiện của tính năng tạo video bằng AI trên Gemini không chỉ đánh dấu bước tiến của Google trong cuộc đua phát triển AI tạo sinh mà còn mở ra cơ hội tiếp cận công cụ sản xuất hình ảnh động dễ dàng hơn cho đông đảo người dùng. Khi công nghệ tiếp tục phát triển, khả năng sáng tạo nội dung video ngắn có thể trở thành tiêu chuẩn mới trong các nền tảng AI tương tác.