Nhận dạng giọng nói tiếng việt Python

Trang này liệt kê tất cả các ngôn ngữ được Cloud Speech-to-Text hỗ trợ. Ngôn ngữ được chỉ định trong tham số languageCode của yêu cầu công nhận. Để biết thêm thông tin về cách gửi yêu cầu nhận dạng và chỉ định ngôn ngữ của bản phiên âm, hãy xem hướng dẫn cách thực hiện nhận dạng giọng nói. Để biết thêm thông tin về khả dụng cho từng ngôn ngữ, hãy xem trang mã thông báo lớp

Hãy thử nó cho chính mình

Nếu bạn mới sử dụng Google Cloud, hãy tạo một tài khoản để đánh giá hiệu quả của tính năng Chuyển giọng nói thành văn bản trong các tình huống thực tế. Khách hàng mới cũng nhận được 300 đô la tín dụng miễn phí để chạy, thử nghiệm và triển khai khối lượng công việc

Dùng thử Speech-to-Text miễn phí

Bảng dưới đây liệt kê các mô hình có sẵn cho từng ngôn ngữ. Cloud Speech-to-Text cung cấp nhiều , mỗi loại được điều chỉnh theo các loại âm thanh khác nhau. Các mô hình nhận dạng lệnh và tìm kiếm mặc định và hỗ trợ tất cả các ngôn ngữ có sẵn. Mô hình lệnh và tìm kiếm được tối ưu hóa cho các đoạn âm thanh ngắn, chẳng hạn như lệnh thoại hoặc tìm kiếm bằng giọng nói. Mô hình mặc định có thể được sử dụng để phiên âm bất kỳ loại âm thanh nào

Một số ngôn ngữ được hỗ trợ bởi các mô hình bổ sung, được tối ưu hóa cho các loại âm thanh bổ sung. cuộc gọi điện thoại nâng cao và video nâng cao. Các kiểu máy này có thể nhận dạng giọng nói được ghi lại từ các nguồn âm thanh này chính xác hơn so với kiểu máy mặc định. Xem trang mô hình nâng cao để biết thêm thông tin. Nếu bất kỳ mô hình bổ sung nào trong số này có sẵn cho ngôn ngữ của bạn, chúng sẽ được liệt kê cùng với mô hình mặc định và lệnh và tìm kiếm cho ngôn ngữ của bạn. Nếu chỉ có các mô hình mặc định, lệnh và tìm kiếm được liệt kê cùng với ngôn ngữ của bạn, thì hiện tại không có mô hình bổ sung nào

Chỉ sử dụng các mã ngôn ngữ được hiển thị trong bảng sau. Các mã ngôn ngữ sau được Google chính thức duy trì và giám sát bên ngoài. Sử dụng mã ngôn ngữ khác có thể dẫn đến phá vỡ các thay đổi

Lọc các tính năng được hỗ trợ

Tất cả

bộ lọc tục tĩu

Dấu câu nói (thêm dấu câu nói)

Biểu tượng cảm xúc được nói (thêm biểu tượng cảm xúc được nói)

Độ tin cậy ở cấp độ từ (Xem trước) (độ tin cậy ở cấp độ từ)

Dấu câu tự động (tự động thêm dấu câu)

Phát hiện người nói (Xem trước) (tự động phát hiện các người nói khác nhau)

Thích ứng mô hình (Xem trước) (nhận dạng từ tùy chỉnh)

Lọc theo ngôn ngữ.

TênBCP-47Mô hìnhDấu chấm câu tự độngNhật ký Thích ứng với mô hìnhTự tin ở cấp độ từBộ lọc thô tụcDấu câu nói Biểu tượng cảm xúc được nóiAfrikaans (Nam Phi)af-ZALệnh và tìm kiếm✔✔Afrikaans (Nam Phi)af-ZAMặc định✔✔Albanian (Albania)sq-ALLệnh và tìm kiếm✔Albanian (Albania)sq-ALMặc định✔