Google Speech-to-Text Python
Nhận dạng giọng nói là một tính năng quan trọng trong một số ứng dụng được sử dụng như tự động hóa gia đình, trí tuệ nhân tạo, v.v. Bài viết này nhằm giới thiệu về cách sử dụng thư viện SpeechRecognition của Python. Điều này rất hữu ích vì nó có thể được sử dụng trên các bộ vi điều khiển như Raspberry Pi với sự trợ giúp của micrô bên ngoài Show Cài đặt cần thiếtSau đây phải được cài đặt Mô-đun nhận dạng giọng nói Python. sudo pip install SpeechRecognition PyAudio. Sử dụng lệnh sau cho người dùng Linux sudo apt-get install python-pyaudio python3-pyaudio Nếu các phiên bản trong kho quá cũ, hãy cài đặt pyaudio bằng lệnh sau sudo apt-get install portaudio19-dev python-all-dev python3-all-dev && sudo pip install pyaudio Sử dụng pip3 thay vì pip cho python3. Người dùng Windows có thể cài đặt pyaudio bằng cách thực hiện lệnh sau trong một thiết bị đầu cuối pip install pyaudio Nhập giọng nói bằng micrô và dịch lời nói thành văn bản
USB Device 0x46d:0x825: Audio (hw:1, 0)
Xử lý sự cốCác vấn đề sau thường gặp phải Micrô bị tắt tiếng. Điều này dẫn đến đầu vào không được nhận. Để kiểm tra điều này, bạn có thể sử dụng alsamixer. Nó có thể được cài đặt bằng cách sử dụng sudo apt-get install libasound2 alsa-utils alsa-oss Loại máy trộn. Đầu ra sẽ trông giống như thế này Simple mixer control 'Master', 0 Capabilities: pvolume pswitch pswitch-joined Playback channels: Front Left - Front Right Limits: Playback 0 - 65536 Mono: Front Left: Playback 41855 [64%] [on] Front Right: Playback 65536 [100%] [on] Simple mixer control 'Capture', 0 Capabilities: cvolume cswitch cswitch-joined Capture channels: Front Left - Front Right Limits: Capture 0 - 65536 Front Left: Capture 0 [0%] [off] #switched off Front Right: Capture 0 [0%] [off] Như bạn có thể thấy, thiết bị chụp hiện đang tắt. Để bật tính năng này, hãy nhập alsamixer Như bạn có thể thấy trong hình đầu tiên, nó đang hiển thị các thiết bị phát lại của chúng tôi. Nhấn F4 để chuyển sang Chụp thiết bị Trong ảnh thứ hai, phần được đánh dấu cho biết thiết bị chụp ảnh bị tắt tiếng. Để bật tiếng, hãy nhấn phím cách. Như bạn có thể thấy trong hình cuối cùng, phần được đánh dấu xác nhận rằng thiết bị chụp không bị tắt tiếng.Micrô hiện tại không được chọn làm thiết bị thu âm. Trong trường hợp này, có thể đặt micrô bằng cách nhập alsamixer và chọn card âm thanh. Tại đây, bạn có thể chọn thiết bị micrô mặc định. Như trong hình, phần bôi đen là nơi bạn phải chọn card âm thanh. Hình ảnh thứ hai hiển thị lựa chọn màn hình cho card âm thanh.
Bài viết này được đóng góp bởi Deepak Srivatsav. Nếu bạn thích GeeksforGeeks và muốn đóng góp, bạn cũng có thể viết một bài báo bằng cách sử dụng write. chuyên viên máy tính. org hoặc gửi bài viết của bạn tới review-team@geeksforgeeks. tổ chức. Xem bài viết của bạn xuất hiện trên trang chính của GeeksforGeeks và trợ giúp các Geeks khác Vui lòng viết nhận xét nếu bạn thấy bất cứ điều gì không chính xác hoặc nếu bạn muốn chia sẻ thêm thông tin về chủ đề đã thảo luận ở trên Là bài phát biểu của GoogleAPI Chuyển giọng nói thành văn bản của Google không miễn phí , tuy nhiên. Miễn phí nhận dạng giọng nói cho âm thanh dưới 60 phút. Đối với các bản ghi âm dài hơn thế, chi phí là $0. 006 mỗi 15 giây. Đối với phiên âm video, chi phí là $0. 006 trên 15 giây đối với video có thời lượng tối đa 60 phút.
Phiên âm 101 Google Speech là gìGoogle Speech-to-Text cho phép các nhà phát triển chuyển đổi âm thanh thành văn bản bằng cách áp dụng các mô hình mạng thần kinh mạnh mẽ trong một API dễ sử dụng . API nhận dạng hơn 120 ngôn ngữ và biến thể để hỗ trợ cơ sở người dùng toàn cầu của bạn. Bạn có thể bật điều khiển và ra lệnh bằng giọng nói, phiên âm âm thanh từ trung tâm cuộc gọi, v.v.
Làm cách nào để chuyển đổi âm thanh thành văn bản trong Python?wav') làm nguồn. audio_text = r. listen(source) # recogginize_() method sẽ đưa ra lỗi yêu cầu nếu API không thể truy cập được, do đó sử dụng xử lý ngoại lệ, hãy thử. # sử dụng tính năng nhận dạng giọng nói của google text = r. recognize_google(audio_text) print('Chuyển bản ghi âm thành văn bản. ') in (văn bản) ngoại trừ. in ('Xin lỗi.
Google có thể chuyển đổi giọng nói khôngKích hoạt Nhập liệu bằng giọng nói trong Google Tài liệu. Bắt đầu sao chép âm thanh của bạn. Khi bạn đã chọn ngôn ngữ, hãy nhấp vào micrô và bắt đầu nói. Tính năng nhập liệu bằng giọng nói sẽ phiên âm bất kỳ nội dung nào phát ra từ micrô máy tính của bạn . |