Tin tức
Bài viết gần đây
Bảo tồn sự thiêng liêng: Quét 3D và sao chép tác phẩm điêu khắc tại Vương cung thánh đường Sainte Anne d'Auray
Bảo tồn sự thiêng liêng: Quét 3D và sao chép tác phẩm điêu khắc tại Vương cung thánh đường Sainte Anne d'Auray 27/06/2025

​​​​​​​Khi di sản văn hóa gặp công nghệ hiện đại – một phương pháp bảo tồn phi xâm lấn đã giúp gìn giữ linh hồn của những công trình tôn giáo trăm năm tuổi.

Tái hiện quá khứ: Máy quét 3D SCANTECH hỗ trợ dự án khảo cổ lịch sử giữa Trung Quốc và Ai Cập
Tái hiện quá khứ: Máy quét 3D SCANTECH hỗ trợ dự án khảo cổ lịch sử giữa Trung Quốc và Ai Cập 27/06/2025

Scan 3D đang từng bước thay đổi cách con người tiếp cận lịch sử – từ quan sát hiện vật sang tái hiện trọn vẹn di sản văn minh cổ đại.

Pin nhiên liệu: Công nghệ xanh thay thế pin truyền thống
Pin nhiên liệu: Công nghệ xanh thay thế pin truyền thống 27/06/2025

Trong bối cảnh thế giới đang cấp thiết chuyển dịch sang các nguồn năng lượng không phát thải, pin nhiên liệu nổi lên như một giải pháp thay thế tiềm năng cho pin truyền thống và động cơ đốt trong. Không chỉ vận hành êm ái và thân thiện môi trường, công nghệ này còn mở ra triển vọng lớn trong giao thông, công nghiệp và đô thị thông minh. Vậy pin nhiên liệu hoạt động như thế nào, ưu điểm ra sao và tương lai của nó sẽ đi đến đâu?

NVIDIA tìm ra phương pháp đào tạo AI mới, yêu cầu lượng dữ liệu đầu vào ít hơn

16/12/2020 3286

NVIDIA đã phát triển một cách tiếp cận mới để đào tạo các mô hình mạng đối xứng tạo sinh (generative adversarial networks - GANs). Phương pháp này yêu cầu lượng dữ liệu đầu vào ít hơn đáng kể so với các phương pháp phổ biến hiện nay. Trong khi chất lượng đào tạo vẫn được đảm bảo tuyệt đối.

Nếu bạn chưa biết thì GAN là hệ thống AI gồm 2 phần riêng biệt:

  • Thứ nhất là Generative network (Mạng sinh), giúp tạo ra các mẫu đào tạo (data giả), với mục tiêu làm sao tạo ra được những dữ liệu giống thật nhất.
  • Thứ hai là Discriminative network (Mạng phân biệt): có nhiệm vụ cố gắng phân biệt giữa dữ liệu thật và dữ liệu giả mạo, sau đó dùng dữ liệu này để “huấn luyện” lại chính Mạng sinh.

Công nghệ GAN

Công nghệ GAN

Các hệ thống GAN đã từng được áp dụng trong nhiều tác vụ chuyên sâu như chuyển đổi chú thích thành các câu chuyện theo từng bối cảnh, đặc biệt là tạo ra những bức ảnh, video nhân tạo với độ chân thực cực cao.

Về cơ bản, để có thể tạo ra các kết quả đáng tin cậy với sự nhất quán cao, các mô hình GAN truyền thống sẽ yêu cầu tối thiểu từ 50.000 đến 100.000 hình ảnh làm dữ liệu đào tạo đầu vào. Nếu lượng dữ liệu đào tạo quá ít, mô hình GAN có xu hướng gặp phải một vấn đề gọi là “overfitting”. Trong trường hợp này, Mạng phân biệt (Discriminative network) sẽ không có đủ cơ sở để huấn luyện cũng như tương tác với Mạng sinh (Generative network) một cách hiệu quả.

Trí tuệ nhân tạo đã có thể viết được hẳn một bài báo chỉ từ vài thông tin

Trước đây, phương pháp phổ biến mà các nhà nghiên cứu AI thường dùng để cố gắng giải quyết vấn đề thiếu dữ liệu đào tạo là sử dụng một kỹ thuật có tên gọi “tăng cường dữ liệu” (data augmentation). Sử dụng thuật toán hình ảnh làm ví dụ một lần nữa, trong trường hợp không có đủ dữ liệu đào tạo cần thiết, các chuyên gia sẽ cố gắng giải quyết vấn đề bằng cách tạo ra những bản sao "méo mó" của các hình ảnh có sẵn, chẳng hạn như cắt, xoay hoặc lật ảnh một hình ảnh gốc để tạo ra nhiều hình ảnh khác làm dữ liệu đào tạo bổ sung. Ý tưởng ở đây là không để mô hình GAN nhìn thấy cùng một hình ảnh chính xác hai lần.

Tuy nhiên, vấn đề với phương pháp này là có thể khiến GAN học được cách bắt chước sự thay đổi không tự nhiên của dữ liệu đào tạo, thay vì tạo ra một cái gì đó mới. Để giải quyết vấn đề, NVIDIA đã phát triển một phương pháp mới có tên gọi “Tăng cường Phân biệt Thích ứng (ADA). Trong đó cốt lõi vẫn là kỹ thuật tăng cường dữ liệu, nhưng triển khai theo cách thích ứng. Thay vì “bóp méo” bừa bãi hình ảnh trong toàn bộ quá trình đào tạo, ADA thực hiện quá trình này một cách chọn lọc và vừa đủ để GAN vẫn đạt hiệu suất tốt nhất.

Kết quả khả quan của phương pháp đào tạo ADA mang đến nhiều ý nghĩa quan trọng trong lĩnh vực trí tuệ nhân tạo. Bởi khâu thu thập đủ lượng dữ liệu đào tạo cần thiết nghe tưởng chừng đơn giản nhưng trên thực tế rất khó khăn. Chẳng hạn đối với một mô hình AI sáng tác văn học, bản sẽ không cần phải lo thiếu dữ liệu đào tạo đầu vào. Tuy nhiên trong trường hợp của một thuật toán AI chuyên phát hiện chứng rối loạn thần kinh hiếm gặp, chỉ riêng việc thu thập đủ dữ liệu đào tạo thôi đã là vấn đề lớn. Một mô hình GAN được đào tạo với cách tiếp cận ADA của NVIDIA có thể giải quyết vấn đề trên.

Nguồn: quantrimang.com


Zalo

(84) 896 555 247