Mnist dataset là gì

Cơ sở dữ liệu MNIST [tiếng Anh: MNIST database, viết tắt từ Modified National Institute of Standards and Technology database[1]] là một cơ sở dữ liệu lớn chứa các chữ số viết tay thường được dùng trong việc huấn luyện các hệ thống xử lý hình ảnh khác nhau.[2][3] Cơ sở dữ liệu này cũng được sử dụng rộng rãi để huấn luyện và kiểm thử trong lĩnh vực học máy.[4][5] Cơ sở dữ liệu được tạo ra bằng cách "trộn lại" các mẫu từ bộ dữ liệu ban đầu của NIST.[6] Những người tạo ra cơ sở dữ liệu cảm thấy rằng vì tập dữ liệu đào tạo của NIST được lấy từ Cục Thống kê Dân số Hoa Kỳ, trong khi tập dữ liệu thử nghiệm lại được lấy từ các sinh viên trung học Hoa Kỳ, vì vậy nó không phù hợp cho các thí nghiệm học máy.[7] Hơn nữa, những hình ảnh đen trắng từ NIST đã bình thường hóa để khớp với hộp giới hạn 28x28 pixel và khử răng cưa không gian [spatial anti-aliasing] với việc đã giới thiệu các mức thang độ xám.[7]

Các ảnh mẫu từ tập thử nghiệm MNIST

Mục lục

  • 1 Xem thêm
  • 2 Tham khảo
  • 3 Đọc thêm
  • 4 Liên kết ngoài

Xem thêmSửa đổi

  • Trang web cơ sở dữ liệu MNIST
  • Danh sách tập dữ liệu dành cho nghiên cứu học máy
  • Caltech 101
  • LabelMe
  • Nhận dạng ký tự quang học

Tham khảoSửa đổi

  1. ^ THE MNIST DATABASE of handwritten digits. Yann LeCun, Courant Institute, NYU Corinna Cortes, Google Labs, New York Christopher J.C. Burges, Microsoft Research, Redmond.
  2. ^ Support vector machines speed pattern recognition - Vision Systems Design. Vision Systems Design. Truy cập ngày 17 tháng 8 năm 2013.
  3. ^ Gangaputra, Sachin. Handwritten digit database. Truy cập ngày 17 tháng 8 năm 2013.
  4. ^ Qiao, Yu [2007]. THE MNIST DATABASE of handwritten digits. Bản gốc lưu trữ ngày 11 tháng 2 năm 2018. Truy cập ngày 18 tháng 8 năm 2013.
  5. ^ Platt, John C. [1999]. Using analytic QP and sparseness to speed training of support vector machines [PDF]. Advances in Neural Information Processing Systems: 557563. Bản gốc [PDF] lưu trữ ngày 4 tháng 3 năm 2016. Truy cập ngày 18 tháng 8 năm 2013.
  6. ^ Grother, Patrick J. NIST Special Database 19 - Handprinted Forms and Characters Database [PDF]. Viện Tiêu chuẩn và Kỹ thuật quốc gia [Hoa Kỳ].
  7. ^ a b LeCun, Yann; Cortez, Corinna; Burges, Christopher C.J. The MNIST Handwritten Digit Database. Yann LeCun's Website yann.lecun.com. Truy cập ngày 30 tháng 4 năm 2020.

Đọc thêmSửa đổi

  • Ciresan, Dan; Meier, Ueli; Schmidhuber, Jürgen [tháng 6 năm 2012]. Multi-column deep neural networks for image classification [PDF]. 2012 IEEE Conference on Computer Vision and Pattern Recognition. New York, NY: Hội Kỹ sư Điện và Điện tử. tr.36423649. arXiv:1202.2745. CiteSeerX10.1.1.300.3283. doi:10.1109/CVPR.2012.6248110. ISBN9781467312264. OCLC812295155. Truy cập ngày 9 tháng 12 năm 2013.

Liên kết ngoàiSửa đổi

  • Trang web chính thức
  • Neural Net for Handwritten Digit Recognition in JavaScript  a JavaScript implementation of a neural network for handwritten digit classification based on the MNIST database
  • Visualization of the MNIST database  groups of images of MNIST handwritten digits on GitHub

Chủ Đề