Tin tức
Bài viết gần đây
V-Proud đào tạo GD&T cho doanh nghiệp FDI sản xuất linh kiện linh kiện ô tô của Hàn Quốc
V-Proud đào tạo GD&T cho doanh nghiệp FDI sản xuất linh kiện linh kiện ô tô của Hàn Quốc 19/11/2024

V-Proud rất vinh dự khi được hỗ trợ doanh nghiệp FDI sản xuất linh kiện ô tô hàng đầu Hàn Quốc tại miền Bắc. Chúng tôi đã mang đến khóa đào tạo GD&T giúp đội ngũ kỹ thuật hiểu sâu hơn, làm việc hiệu quả hơn và đáp ứng tốt các yêu cầu của thị trường quốc tế.

Thiết Kế Ngược Bằng Máy Quét 3D Laser: Ứng Dụng và Quy Trình
Thiết Kế Ngược Bằng Máy Quét 3D Laser: Ứng Dụng và Quy Trình 31/10/2024

Thiết kế ngược bằng máy quét 3D laser là giải pháp công nghệ cao giúp tái tạo, cải tiến các bộ phận công nghiệp với độ chính xác vượt trội. Bài viết này sẽ chia sẻ chi tiết về quy trình thiết kế ngược, từ các bước cơ bản đến việc ứng dụng mô hình CAD, đặc biệt hữu ích cho các ngành cơ khí chế tạo, sản xuất ôtô, hàng không và công nghiệp.

V-PROUD TẠI VIMEXPO2024: "SẴN SÀNG CHINH PHỤC"
V-PROUD TẠI VIMEXPO2024: "SẴN SÀNG CHINH PHỤC" 16/10/2024

"Không khí triển lãm VIMEXPO2024 đang nóng lên từng ngày! V-PROUD đã sẵn sàng để mang đến những trải nghiệm đo lường đột phá nhất."

NVIDIA tìm ra phương pháp đào tạo AI mới, yêu cầu lượng dữ liệu đầu vào ít hơn

16/12/2020 2402

NVIDIA đã phát triển một cách tiếp cận mới để đào tạo các mô hình mạng đối xứng tạo sinh (generative adversarial networks - GANs). Phương pháp này yêu cầu lượng dữ liệu đầu vào ít hơn đáng kể so với các phương pháp phổ biến hiện nay. Trong khi chất lượng đào tạo vẫn được đảm bảo tuyệt đối.

Nếu bạn chưa biết thì GAN là hệ thống AI gồm 2 phần riêng biệt:

  • Thứ nhất là Generative network (Mạng sinh), giúp tạo ra các mẫu đào tạo (data giả), với mục tiêu làm sao tạo ra được những dữ liệu giống thật nhất.
  • Thứ hai là Discriminative network (Mạng phân biệt): có nhiệm vụ cố gắng phân biệt giữa dữ liệu thật và dữ liệu giả mạo, sau đó dùng dữ liệu này để “huấn luyện” lại chính Mạng sinh.

Công nghệ GAN

Công nghệ GAN

Các hệ thống GAN đã từng được áp dụng trong nhiều tác vụ chuyên sâu như chuyển đổi chú thích thành các câu chuyện theo từng bối cảnh, đặc biệt là tạo ra những bức ảnh, video nhân tạo với độ chân thực cực cao.

Về cơ bản, để có thể tạo ra các kết quả đáng tin cậy với sự nhất quán cao, các mô hình GAN truyền thống sẽ yêu cầu tối thiểu từ 50.000 đến 100.000 hình ảnh làm dữ liệu đào tạo đầu vào. Nếu lượng dữ liệu đào tạo quá ít, mô hình GAN có xu hướng gặp phải một vấn đề gọi là “overfitting”. Trong trường hợp này, Mạng phân biệt (Discriminative network) sẽ không có đủ cơ sở để huấn luyện cũng như tương tác với Mạng sinh (Generative network) một cách hiệu quả.

Trí tuệ nhân tạo đã có thể viết được hẳn một bài báo chỉ từ vài thông tin

Trước đây, phương pháp phổ biến mà các nhà nghiên cứu AI thường dùng để cố gắng giải quyết vấn đề thiếu dữ liệu đào tạo là sử dụng một kỹ thuật có tên gọi “tăng cường dữ liệu” (data augmentation). Sử dụng thuật toán hình ảnh làm ví dụ một lần nữa, trong trường hợp không có đủ dữ liệu đào tạo cần thiết, các chuyên gia sẽ cố gắng giải quyết vấn đề bằng cách tạo ra những bản sao "méo mó" của các hình ảnh có sẵn, chẳng hạn như cắt, xoay hoặc lật ảnh một hình ảnh gốc để tạo ra nhiều hình ảnh khác làm dữ liệu đào tạo bổ sung. Ý tưởng ở đây là không để mô hình GAN nhìn thấy cùng một hình ảnh chính xác hai lần.

Tuy nhiên, vấn đề với phương pháp này là có thể khiến GAN học được cách bắt chước sự thay đổi không tự nhiên của dữ liệu đào tạo, thay vì tạo ra một cái gì đó mới. Để giải quyết vấn đề, NVIDIA đã phát triển một phương pháp mới có tên gọi “Tăng cường Phân biệt Thích ứng (ADA). Trong đó cốt lõi vẫn là kỹ thuật tăng cường dữ liệu, nhưng triển khai theo cách thích ứng. Thay vì “bóp méo” bừa bãi hình ảnh trong toàn bộ quá trình đào tạo, ADA thực hiện quá trình này một cách chọn lọc và vừa đủ để GAN vẫn đạt hiệu suất tốt nhất.

Kết quả khả quan của phương pháp đào tạo ADA mang đến nhiều ý nghĩa quan trọng trong lĩnh vực trí tuệ nhân tạo. Bởi khâu thu thập đủ lượng dữ liệu đào tạo cần thiết nghe tưởng chừng đơn giản nhưng trên thực tế rất khó khăn. Chẳng hạn đối với một mô hình AI sáng tác văn học, bản sẽ không cần phải lo thiếu dữ liệu đào tạo đầu vào. Tuy nhiên trong trường hợp của một thuật toán AI chuyên phát hiện chứng rối loạn thần kinh hiếm gặp, chỉ riêng việc thu thập đủ dữ liệu đào tạo thôi đã là vấn đề lớn. Một mô hình GAN được đào tạo với cách tiếp cận ADA của NVIDIA có thể giải quyết vấn đề trên.

Nguồn: quantrimang.com


Zalo

(84) 896 555 247