Tin tức
Bài viết gần đây
V-PROUD TẠI VIMEXPO2024: "SẴN SÀNG CHINH PHỤC"
V-PROUD TẠI VIMEXPO2024: "SẴN SÀNG CHINH PHỤC" 16/10/2024

"Không khí triển lãm VIMEXPO2024 đang nóng lên từng ngày! V-PROUD đã sẵn sàng để mang đến những trải nghiệm đo lường đột phá nhất."

V-PROUD SẼ MANG ĐẾN ĐIỀU BẤT NGỜ GÌ TẠI VIMEXPO 2024?
V-PROUD SẼ MANG ĐẾN ĐIỀU BẤT NGỜ GÌ TẠI VIMEXPO 2024? 11/10/2024

Công ty Cổ phần V-PROUD vui mừng thông báo về sự tham gia của chúng tôi tại Triển lãm Quốc tế hàng đầu về Công nghiệp hỗ trợ - VIMEXPO 2024, diễn ra từ ngày 17 đến 19 tháng 10 năm 2024, tại Trung tâm Triển lãm Quốc tế I.C.E Hà Nội. Đây là sự kiện quy tụ nhiều doanh nghiệp và công nghệ tiên tiến nhất.

V-Proud tài trợ khóa đào tạo GD&T tại chương trình con quay đại chiến – triển lãm FBC 2024
V-Proud tài trợ khóa đào tạo GD&T tại chương trình con quay đại chiến – triển lãm FBC 2024 09/10/2024

Sự kiện trao tặng khóa học GD&T của V-Proud cho đội thắng cuộc không chỉ đánh dấu một cột mốc quan trọng trong chương trình Con Quay Đại Chiến tại triển lãm FBC 2024 mà còn thể hiện cam kết của V-Proud trong việc hỗ trợ và phát triển nguồn nhân lực chất lượng cao cho ngành cơ khí chính xác. Chúng tôi tin rằng, với những kiến thức chuyên sâu từ khóa học này, đội thi sẽ tiếp tục tỏa sáng và đạt được những thành công đáng kể trong tương lai.

NVIDIA tìm ra phương pháp đào tạo AI mới, yêu cầu lượng dữ liệu đầu vào ít hơn

16/12/2020 2268

NVIDIA đã phát triển một cách tiếp cận mới để đào tạo các mô hình mạng đối xứng tạo sinh (generative adversarial networks - GANs). Phương pháp này yêu cầu lượng dữ liệu đầu vào ít hơn đáng kể so với các phương pháp phổ biến hiện nay. Trong khi chất lượng đào tạo vẫn được đảm bảo tuyệt đối.

Nếu bạn chưa biết thì GAN là hệ thống AI gồm 2 phần riêng biệt:

  • Thứ nhất là Generative network (Mạng sinh), giúp tạo ra các mẫu đào tạo (data giả), với mục tiêu làm sao tạo ra được những dữ liệu giống thật nhất.
  • Thứ hai là Discriminative network (Mạng phân biệt): có nhiệm vụ cố gắng phân biệt giữa dữ liệu thật và dữ liệu giả mạo, sau đó dùng dữ liệu này để “huấn luyện” lại chính Mạng sinh.

Công nghệ GAN

Công nghệ GAN

Các hệ thống GAN đã từng được áp dụng trong nhiều tác vụ chuyên sâu như chuyển đổi chú thích thành các câu chuyện theo từng bối cảnh, đặc biệt là tạo ra những bức ảnh, video nhân tạo với độ chân thực cực cao.

Về cơ bản, để có thể tạo ra các kết quả đáng tin cậy với sự nhất quán cao, các mô hình GAN truyền thống sẽ yêu cầu tối thiểu từ 50.000 đến 100.000 hình ảnh làm dữ liệu đào tạo đầu vào. Nếu lượng dữ liệu đào tạo quá ít, mô hình GAN có xu hướng gặp phải một vấn đề gọi là “overfitting”. Trong trường hợp này, Mạng phân biệt (Discriminative network) sẽ không có đủ cơ sở để huấn luyện cũng như tương tác với Mạng sinh (Generative network) một cách hiệu quả.

Trí tuệ nhân tạo đã có thể viết được hẳn một bài báo chỉ từ vài thông tin

Trước đây, phương pháp phổ biến mà các nhà nghiên cứu AI thường dùng để cố gắng giải quyết vấn đề thiếu dữ liệu đào tạo là sử dụng một kỹ thuật có tên gọi “tăng cường dữ liệu” (data augmentation). Sử dụng thuật toán hình ảnh làm ví dụ một lần nữa, trong trường hợp không có đủ dữ liệu đào tạo cần thiết, các chuyên gia sẽ cố gắng giải quyết vấn đề bằng cách tạo ra những bản sao "méo mó" của các hình ảnh có sẵn, chẳng hạn như cắt, xoay hoặc lật ảnh một hình ảnh gốc để tạo ra nhiều hình ảnh khác làm dữ liệu đào tạo bổ sung. Ý tưởng ở đây là không để mô hình GAN nhìn thấy cùng một hình ảnh chính xác hai lần.

Tuy nhiên, vấn đề với phương pháp này là có thể khiến GAN học được cách bắt chước sự thay đổi không tự nhiên của dữ liệu đào tạo, thay vì tạo ra một cái gì đó mới. Để giải quyết vấn đề, NVIDIA đã phát triển một phương pháp mới có tên gọi “Tăng cường Phân biệt Thích ứng (ADA). Trong đó cốt lõi vẫn là kỹ thuật tăng cường dữ liệu, nhưng triển khai theo cách thích ứng. Thay vì “bóp méo” bừa bãi hình ảnh trong toàn bộ quá trình đào tạo, ADA thực hiện quá trình này một cách chọn lọc và vừa đủ để GAN vẫn đạt hiệu suất tốt nhất.

Kết quả khả quan của phương pháp đào tạo ADA mang đến nhiều ý nghĩa quan trọng trong lĩnh vực trí tuệ nhân tạo. Bởi khâu thu thập đủ lượng dữ liệu đào tạo cần thiết nghe tưởng chừng đơn giản nhưng trên thực tế rất khó khăn. Chẳng hạn đối với một mô hình AI sáng tác văn học, bản sẽ không cần phải lo thiếu dữ liệu đào tạo đầu vào. Tuy nhiên trong trường hợp của một thuật toán AI chuyên phát hiện chứng rối loạn thần kinh hiếm gặp, chỉ riêng việc thu thập đủ dữ liệu đào tạo thôi đã là vấn đề lớn. Một mô hình GAN được đào tạo với cách tiếp cận ADA của NVIDIA có thể giải quyết vấn đề trên.

Nguồn: quantrimang.com


Zalo

(84) 896 555 247