Tin tức
Bài viết gần đây
Google gỡ nội dung AI Overviews sai sự thật về sức khỏe
Google gỡ nội dung AI Overviews sai sự thật về sức khỏe 13/01/2026

Google gỡ bỏ một số bản tóm tắt về sức khỏe trên AI Overviews sau khi bị phát hiện tính năng cung cấp thông tin sai lệch, gây hiểu nhầm.

Chủ siêu dự án điện gió 5 tỷ USD tiếp tục thắng kiện chính quyền ông Trump
Chủ siêu dự án điện gió 5 tỷ USD tiếp tục thắng kiện chính quyền ông Trump 13/01/2026

Nhà phát triển siêu dự án điện gió Revolution Wind 5 tỷ USD thắng kiện chính quyền ông Trump liên quan đến lệnh đình chỉ dự án khi gần hoàn thiện. Ngày 13/1, thẩm phán Tòa án Quận Mỹ Royce Lamberth cho phép Orsted, nhà phát triển điện gió ngoài khơi của Đan Mạch, tiếp tục triển khai siêu dự án Revolution Wind. Dự án này đã được hoàn thành khoảng 87% và dự kiến bắt đầu phát điện trong năm nay.

Cuộc cải tổ để vực dậy Intel
Cuộc cải tổ để vực dậy Intel 24/12/2025

Cải tổ theo hướng tinh gọn và kỷ luật tài chính hơn, CEO Intel Lip-Bu Tan hy vọng vực dậy tượng đài sản xuất chip một thời của Mỹ.

NVIDIA tìm ra phương pháp đào tạo AI mới, yêu cầu lượng dữ liệu đầu vào ít hơn

16/12/2020 3681

NVIDIA đã phát triển một cách tiếp cận mới để đào tạo các mô hình mạng đối xứng tạo sinh (generative adversarial networks - GANs). Phương pháp này yêu cầu lượng dữ liệu đầu vào ít hơn đáng kể so với các phương pháp phổ biến hiện nay. Trong khi chất lượng đào tạo vẫn được đảm bảo tuyệt đối.

MỤC LỤC BÀI VIẾT

    Nếu bạn chưa biết thì GAN là hệ thống AI gồm 2 phần riêng biệt:

    • Thứ nhất là Generative network (Mạng sinh), giúp tạo ra các mẫu đào tạo (data giả), với mục tiêu làm sao tạo ra được những dữ liệu giống thật nhất.
    • Thứ hai là Discriminative network (Mạng phân biệt): có nhiệm vụ cố gắng phân biệt giữa dữ liệu thật và dữ liệu giả mạo, sau đó dùng dữ liệu này để “huấn luyện” lại chính Mạng sinh.

    Công nghệ GAN

    Công nghệ GAN

    Các hệ thống GAN đã từng được áp dụng trong nhiều tác vụ chuyên sâu như chuyển đổi chú thích thành các câu chuyện theo từng bối cảnh, đặc biệt là tạo ra những bức ảnh, video nhân tạo với độ chân thực cực cao.

    Về cơ bản, để có thể tạo ra các kết quả đáng tin cậy với sự nhất quán cao, các mô hình GAN truyền thống sẽ yêu cầu tối thiểu từ 50.000 đến 100.000 hình ảnh làm dữ liệu đào tạo đầu vào. Nếu lượng dữ liệu đào tạo quá ít, mô hình GAN có xu hướng gặp phải một vấn đề gọi là “overfitting”. Trong trường hợp này, Mạng phân biệt (Discriminative network) sẽ không có đủ cơ sở để huấn luyện cũng như tương tác với Mạng sinh (Generative network) một cách hiệu quả.

    Trí tuệ nhân tạo đã có thể viết được hẳn một bài báo chỉ từ vài thông tin

    Trước đây, phương pháp phổ biến mà các nhà nghiên cứu AI thường dùng để cố gắng giải quyết vấn đề thiếu dữ liệu đào tạo là sử dụng một kỹ thuật có tên gọi “tăng cường dữ liệu” (data augmentation). Sử dụng thuật toán hình ảnh làm ví dụ một lần nữa, trong trường hợp không có đủ dữ liệu đào tạo cần thiết, các chuyên gia sẽ cố gắng giải quyết vấn đề bằng cách tạo ra những bản sao "méo mó" của các hình ảnh có sẵn, chẳng hạn như cắt, xoay hoặc lật ảnh một hình ảnh gốc để tạo ra nhiều hình ảnh khác làm dữ liệu đào tạo bổ sung. Ý tưởng ở đây là không để mô hình GAN nhìn thấy cùng một hình ảnh chính xác hai lần.

    Tuy nhiên, vấn đề với phương pháp này là có thể khiến GAN học được cách bắt chước sự thay đổi không tự nhiên của dữ liệu đào tạo, thay vì tạo ra một cái gì đó mới. Để giải quyết vấn đề, NVIDIA đã phát triển một phương pháp mới có tên gọi “Tăng cường Phân biệt Thích ứng (ADA). Trong đó cốt lõi vẫn là kỹ thuật tăng cường dữ liệu, nhưng triển khai theo cách thích ứng. Thay vì “bóp méo” bừa bãi hình ảnh trong toàn bộ quá trình đào tạo, ADA thực hiện quá trình này một cách chọn lọc và vừa đủ để GAN vẫn đạt hiệu suất tốt nhất.

    Kết quả khả quan của phương pháp đào tạo ADA mang đến nhiều ý nghĩa quan trọng trong lĩnh vực trí tuệ nhân tạo. Bởi khâu thu thập đủ lượng dữ liệu đào tạo cần thiết nghe tưởng chừng đơn giản nhưng trên thực tế rất khó khăn. Chẳng hạn đối với một mô hình AI sáng tác văn học, bản sẽ không cần phải lo thiếu dữ liệu đào tạo đầu vào. Tuy nhiên trong trường hợp của một thuật toán AI chuyên phát hiện chứng rối loạn thần kinh hiếm gặp, chỉ riêng việc thu thập đủ dữ liệu đào tạo thôi đã là vấn đề lớn. Một mô hình GAN được đào tạo với cách tiếp cận ADA của NVIDIA có thể giải quyết vấn đề trên.

    Nguồn: quantrimang.com


    Zalo

    (84) 896 555 247