Dịch văn bản sang các ngôn ngữ khác bằng python

Dịch ngôn ngữ là rất quan trọng đối với bất kỳ cá nhân hoặc tổ chức nào trong đó khách hàng đa ngôn ngữ đến từ các quốc gia khác nhau. Nhiều bài thuyết trình, trích dẫn, báo cáo, v.v. được gửi bằng các ngôn ngữ khác nhau cho công ty tài trợ từ các khách hàng tương ứng của họ và cơ quan chính phải dịch giống nhau để phân tích nội hàm của các từ được viết và sau đó đưa ra câu trả lời cho phù hợp. Đối với các ngôn ngữ dịch, Google được coi là người chơi hàng đầu vì nó cung cấp một tính năng của Google dịch có thể thực hiện công việc dịch thuật cho chúng tôi. Người ta chỉ cần cung cấp dữ liệu mà anh / cô ấy muốn dịch và đợi Google thực hiện công việc của mình. Mọi người trên khắp thế giới sử dụng Google Dịch để hiểu ý nghĩa ngữ nghĩa của văn bản. Nhưng điều gì sẽ xảy ra nếu công cụ dịch thuật này có thể được thực hiện với sự trợ giúp của mã hóa, đặc biệt là thông qua Python ??

Chà, có thể vì Google dịch là một API có thể cài đặt cho Python để chúng tôi có thể sử dụng nó như một thư viện của bên thứ ba và thực hiện tác vụ dự kiến. Tên của thư viện có sẵn cho Python là Google Trans. Thư viện này hoạt động giống như Google dịch thực tế và nó được tạo cho Python để giúp giải quyết các tác vụ liên quan đến NLP.

Ví dụ. Nếu tập dữ liệu mà chúng tôi có bằng ngôn ngữ Tamil và chúng tôi muốn dịch chúng sang tiếng Anh hoặc tiếng Hindi thì Google Trans có thể thực hiện công việc cho chúng tôi chỉ với một vài dòng mã. Vì vậy, hãy xem cách cài đặt tương tự bằng Python và cách làm việc bằng cách sử dụng tương tự:

Cài đặt

Using Simple Python

Các bước cài đặt được thực hiện có tính đến việc Python hoặc Anaconda đã có sẵn trong hệ thống của bạn với pip cài đặt.

  • Mở Command Prompt và nhập Python. Nếu nó không xảy ra lỗi thì Python đã có trong hệ thống và bạn đã sẵn sàng.
  • Một lần nữa trong Command Prompt chỉ cần nhập pip và nếu nó không xuất hiện lỗi thì pip đã có trong hệ thống.
  • Bây giờ chỉ cần gõ pip install googletrans. Sau khi hoàn tất, hãy mở sổ ghi chép Jupyter của bạn hoặc bất kỳ trình soạn thảo văn bản nào khác và nhập nó bằng cách sử dụng from googletrans import Translator.

Using Anaconda

  • Mở Command Prompt và kiểm tra tính khả dụng của Anaconda và pip bằng cách gõ conda pip từng cái một. Nếu nó không có lỗi thì mọi thứ đang hoạt động tốt.
  • Bước tiếp theo là tạo một môi trường ảo trong Anaconda, nơi bạn sẽ lưu trữ API Google Dịch. Đối với điều này, bạn có thể làm conda create –n yourenvname.
  • Sau khi môi trường được tạo, chỉ cần nhập conda kích hoạt yourenvname và môi trường sẽ được kích hoạt và sử dụng được.
  • Bây giờ chỉ cần làm pip install googletransvà đợi quá trình tải xuống hoàn tất.
  • Bây giờ hãy mở IDE mã của bạn và nhập from googletrans import Translator và điều này sẽ nhập API phiên dịch cho bạn.

Làm việc

Các bước làm việc được mô tả bằng cách sử dụng các hình ảnh để bạn có ý tưởng tốt hơn về cách sử dụng các bước tương tự cho mục đích của mình.

#!pip install googletrans
from googletrans import Translator
sentence= str(input("say....."))
translator= Translator()
translated= translator.translate(sentence, dest="ta", src"en")
tranlated.text

Dịch văn bản sang các ngôn ngữ khác bằng python

Sự kết luận

Vì vậy, đây là cách người ta có thể sử dụng API Google Dịch này để dịch ngôn ngữ của cơ sở dữ liệu của họ và sau đó sử dụng nó cho mục đích làm việc của họ.

Trong bài học này chúng ta sẽ tìm hiểu googletrans, hay còn gọi là Python Google Translator, đây là một module dùng để dịch văn bản qua các ngôn ngữ bằng cách sử dụng Google API.

Dịch văn bản sang các ngôn ngữ khác bằng python

Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

1. Python Google Translator là gì?

Python googletrans là một module để dịch văn bản. Nó sử dụng API Google Translate Ajax để phát hiện ngôn ngữ và dịch văn bản sang ngôn ngữ mong muốn.

Trước khi sử dụng thì bạn phải kiểm tra trong máy của mình đã cài đặt module này chưa nhé, cách đơn giản nhất là chạy lệnh import sau đây:

Nếu lệnh này báo lỗi thì tức là máy của bạn chưa cài. Lúc này bạn hãy mở cửa sổ console lên và chạy lệnh sau:

Bài viết này được đăng tại [free tuts .net]

Giao diện cài đặt sẽ như sau:

Bạn hãy chạy lại lệnh import trên thì sẽ không thấy lỗi nữa.

2. Danh sách ngôn ngữ trong Python Google Translator module

Trước khi dịch sang một ngôn ngữ nào thì bạn nên kiểm tra xem Google API có hỗ trợ ngôn ngữ đó không.

Module googletrans có một thuộc tính tên là LANGUAGES, nó là một dict chứa danh sách các ngôn ngữ. Chạy lệnh sau để in ra.

import googletrans
print(googletrans.LANGUAGES)

Kết quả:

{'af': 'afrikaans', 'sq': 'albanian', 'am': 'amharic', 'ar': 'arabic', 'hy': 'armenian', 'az': 'azerbaijani', 'eu': 'basque', 'be': 'belarusian', 'bn': 'bengali', 'bs': 'bosnian', 'bg': 'bulgarian', 'ca': 'catalan', 'ceb': 'cebuano', 'ny': 'chichewa', 'zh-cn': 'chinese (simplified)', 'zh-tw': 'chinese (traditional)', 'co': 'corsican', 'hr': 'croatian', 'cs': 'czech', 'da': 'danish', 'nl': 'dutch', 'en': 'english', 'eo': 'esperanto', 'et': 'estonian', 'tl': 'filipino', 'fi': 'finnish', 'fr': 'french', 'fy': 'frisian', 'gl': 'galician', 'ka': 'georgian', 'de': 'german', 'el': 'greek', 'gu': 'gujarati', 'ht': 'haitian creole', 'ha': 'hausa', 'haw': 'hawaiian', 'iw': 'hebrew', 'he': 'hebrew', 'hi': 'hindi', 'hmn': 'hmong', 'hu': 'hungarian', 'is': 'icelandic', 'ig': 'igbo', 'id': 'indonesian', 'ga': 'irish', 'it': 'italian', 'ja': 'japanese', 'jw': 'javanese', 'kn': 'kannada', 'kk': 'kazakh', 'km': 'khmer', 'ko': 'korean', 'ku': 'kurdish (kurmanji)', 'ky': 'kyrgyz', 'lo': 'lao', 'la': 'latin', 'lv': 'latvian', 'lt': 'lithuanian', 'lb': 'luxembourgish', 'mk': 'macedonian', 'mg': 'malagasy', 'ms': 'malay', 'ml': 'malayalam', 'mt': 'maltese', 'mi': 'maori', 'mr': 'marathi', 'mn': 'mongolian', 'my': 'myanmar (burmese)', 'ne': 'nepali', 'no': 'norwegian', 'or': 'odia', 'ps': 'pashto', 'fa': 'persian', 'pl': 'polish', 'pt': 'portuguese', 'pa': 'punjabi', 'ro': 'romanian', 'ru': 'russian', 'sm': 'samoan', 'gd': 'scots gaelic', 'sr': 'serbian', 'st': 'sesotho', 'sn': 'shona', 'sd': 'sindhi', 'si': 'sinhala', 'sk': 'slovak', 'sl': 'slovenian', 'so': 'somali', 'es': 'spanish', 'su': 'sundanese', 'sw': 'swahili', 'sv': 'swedish', 'tg': 'tajik', 'ta': 'tamil', 'te': 'telugu', 'th': 'thai', 'tr': 'turkish', 'uk': 'ukrainian', 'ur': 'urdu', 'ug': 'uyghur', 'uz': 'uzbek', 'vi': 'vietnamese', 'cy': 'welsh', 'xh': 'xhosa', 'yi': 'yiddish', 'yo': 'yoruba', 'zu': 'zulu'}

3. Dùng Python Google Translator nhận diện ngôn ngữ của text

Google Translator có khả năng nhận diện ngôn ngữ của một đoạn text, đây chính là ưu điểm lớn nhất của bộ công cụ dịch thuật của Google.

Bây giờ mình thử detect một đoạn xem đó là ngôn ngữ gì nhé.

from googletrans import Translator

text = 'Học Python miễn phí tại freetuts.net'
translator = Translator()
dt = translator.detect(text)
print(dt)

Kết quả:

Detected(lang=vi, confidence=1.0)

4. Dịch một đoạn text bằng Python Google Translator

Để dịch một ngôn ngữ này sang một ngôn ngữ khác thì ta sử dụng đoạn code sau:

from googletrans import Translator

translator = Translator()

translated = translator.translate('svízelná situace', src='cs', dest='hu')

print(translated.text)

Trong đó:

  • src là ngôn ngữ ban đầu của đoạn text.
  • dest là ngôn ngữ cần dịch sang.
  • svízelná situace là đoạn text cần dịch.

Ngoài ra bạn cũng có thể truyền danh sách nhiều text cần dịch bằng cách đặt nó vào một mảng.

from googletrans import Translator

translator = Translator()

data = ['Dobrý deň', 'majestátny orol', 'krehká dohoda']

translated = translator.translate(data, src='sk', dest='en')

for trans in translated:
    print(f'{trans.origin} -> {trans.text}')

Trên là cách sử dụng module Google Translator trong Python. Bạn có thể tham khảo thêm nội dung trên trang chủ của Python pip nhé.