Dịch văn bản sang các ngôn ngữ khác bằng python
Dịch ngôn ngữ là rất quan trọng đối với bất kỳ cá nhân hoặc tổ chức nào trong đó khách hàng đa ngôn ngữ đến từ các quốc gia khác nhau. Nhiều bài thuyết trình, trích dẫn, báo cáo, v.v. được gửi bằng các ngôn ngữ khác nhau cho công ty tài trợ từ các khách hàng tương ứng của họ và cơ quan chính phải dịch giống nhau để phân tích nội hàm của các từ được viết và sau đó đưa ra câu trả lời cho phù hợp. Đối với các ngôn ngữ dịch, Google được coi là người chơi hàng đầu vì nó cung cấp một tính năng của Google dịch có thể thực hiện công việc dịch thuật cho chúng tôi. Người ta chỉ cần cung cấp dữ liệu mà anh / cô ấy muốn dịch và đợi Google thực hiện công việc của mình. Mọi người trên khắp thế giới sử dụng Google Dịch để hiểu ý nghĩa ngữ nghĩa của văn bản. Nhưng điều gì sẽ xảy ra nếu công cụ dịch thuật này có thể được thực hiện với sự trợ giúp của mã hóa, đặc biệt là thông qua Python ?? Show Chà, có thể vì Google dịch là một API có thể cài đặt cho Python để chúng tôi có thể sử dụng nó như một thư viện của bên thứ ba và thực hiện tác vụ dự kiến. Tên của thư viện có sẵn cho Python là Google Trans. Thư viện này hoạt động giống như Google dịch thực tế và nó được tạo cho Python để giúp giải quyết các tác vụ liên quan đến NLP. Ví dụ. Nếu tập dữ liệu mà chúng tôi có bằng ngôn ngữ Tamil và chúng tôi muốn dịch chúng sang tiếng Anh hoặc tiếng Hindi thì Google Trans có thể thực hiện công việc cho chúng tôi chỉ với một vài dòng mã. Vì vậy, hãy xem cách cài đặt tương tự bằng Python và cách làm việc bằng cách sử dụng tương tự: Cài đặtUsing Simple Python Các bước cài đặt được thực hiện có tính đến việc Python hoặc Anaconda đã có sẵn trong hệ thống của bạn với pip cài đặt.
Using Anaconda
Làm việcCác bước làm việc được mô tả bằng cách sử dụng các hình ảnh để bạn có ý tưởng tốt hơn về cách sử dụng các bước tương tự cho mục đích của mình. #!pip install googletrans from googletrans import Translator sentence= str(input("say.....")) translator= Translator() translated= translator.translate(sentence, dest="ta", src"en") tranlated.text Sự kết luậnVì vậy, đây là cách người ta có thể sử dụng API Google Dịch này để dịch ngôn ngữ của cơ sở dữ liệu của họ và sau đó sử dụng nó cho mục đích làm việc của họ. Trong bài học này chúng ta sẽ tìm hiểu googletrans, hay còn gọi là Python Google Translator, đây là một module dùng để dịch văn bản qua các ngôn ngữ bằng cách sử dụng Google API. Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức. 1. Python Google Translator là gì?Python googletrans là một module để dịch văn bản. Nó sử dụng API Google Translate Ajax để phát hiện ngôn ngữ và dịch văn bản sang ngôn ngữ mong muốn. Trước khi sử dụng thì bạn phải kiểm tra trong máy của mình đã cài đặt module này chưa nhé, cách đơn giản nhất là chạy lệnh import sau đây: Nếu lệnh này báo lỗi thì tức là máy của bạn chưa cài. Lúc này bạn hãy mở cửa sổ console lên và chạy lệnh sau: Bài viết này được đăng tại [free tuts .net] Giao diện cài đặt sẽ như sau: Bạn hãy chạy lại lệnh import trên thì sẽ không thấy lỗi nữa. 2. Danh sách ngôn ngữ trong Python Google Translator moduleTrước khi dịch sang một ngôn ngữ nào thì bạn nên kiểm tra xem Google API có hỗ trợ ngôn ngữ đó không. Module googletrans có một thuộc tính tên là LANGUAGES, nó là một dict chứa danh sách các ngôn ngữ. Chạy lệnh sau để in ra. import googletrans print(googletrans.LANGUAGES) Kết quả: {'af': 'afrikaans', 'sq': 'albanian', 'am': 'amharic', 'ar': 'arabic', 'hy': 'armenian', 'az': 'azerbaijani', 'eu': 'basque', 'be': 'belarusian', 'bn': 'bengali', 'bs': 'bosnian', 'bg': 'bulgarian', 'ca': 'catalan', 'ceb': 'cebuano', 'ny': 'chichewa', 'zh-cn': 'chinese (simplified)', 'zh-tw': 'chinese (traditional)', 'co': 'corsican', 'hr': 'croatian', 'cs': 'czech', 'da': 'danish', 'nl': 'dutch', 'en': 'english', 'eo': 'esperanto', 'et': 'estonian', 'tl': 'filipino', 'fi': 'finnish', 'fr': 'french', 'fy': 'frisian', 'gl': 'galician', 'ka': 'georgian', 'de': 'german', 'el': 'greek', 'gu': 'gujarati', 'ht': 'haitian creole', 'ha': 'hausa', 'haw': 'hawaiian', 'iw': 'hebrew', 'he': 'hebrew', 'hi': 'hindi', 'hmn': 'hmong', 'hu': 'hungarian', 'is': 'icelandic', 'ig': 'igbo', 'id': 'indonesian', 'ga': 'irish', 'it': 'italian', 'ja': 'japanese', 'jw': 'javanese', 'kn': 'kannada', 'kk': 'kazakh', 'km': 'khmer', 'ko': 'korean', 'ku': 'kurdish (kurmanji)', 'ky': 'kyrgyz', 'lo': 'lao', 'la': 'latin', 'lv': 'latvian', 'lt': 'lithuanian', 'lb': 'luxembourgish', 'mk': 'macedonian', 'mg': 'malagasy', 'ms': 'malay', 'ml': 'malayalam', 'mt': 'maltese', 'mi': 'maori', 'mr': 'marathi', 'mn': 'mongolian', 'my': 'myanmar (burmese)', 'ne': 'nepali', 'no': 'norwegian', 'or': 'odia', 'ps': 'pashto', 'fa': 'persian', 'pl': 'polish', 'pt': 'portuguese', 'pa': 'punjabi', 'ro': 'romanian', 'ru': 'russian', 'sm': 'samoan', 'gd': 'scots gaelic', 'sr': 'serbian', 'st': 'sesotho', 'sn': 'shona', 'sd': 'sindhi', 'si': 'sinhala', 'sk': 'slovak', 'sl': 'slovenian', 'so': 'somali', 'es': 'spanish', 'su': 'sundanese', 'sw': 'swahili', 'sv': 'swedish', 'tg': 'tajik', 'ta': 'tamil', 'te': 'telugu', 'th': 'thai', 'tr': 'turkish', 'uk': 'ukrainian', 'ur': 'urdu', 'ug': 'uyghur', 'uz': 'uzbek', 'vi': 'vietnamese', 'cy': 'welsh', 'xh': 'xhosa', 'yi': 'yiddish', 'yo': 'yoruba', 'zu': 'zulu'} 3. Dùng Python Google Translator nhận diện ngôn ngữ của textGoogle Translator có khả năng nhận diện ngôn ngữ của một đoạn text, đây chính là ưu điểm lớn nhất của bộ công cụ dịch thuật của Google. Bây giờ mình thử detect một đoạn xem đó là ngôn ngữ gì nhé. from googletrans import Translator text = 'Học Python miễn phí tại freetuts.net' translator = Translator() dt = translator.detect(text) print(dt) Kết quả: Detected(lang=vi, confidence=1.0) 4. Dịch một đoạn text bằng Python Google TranslatorĐể dịch một ngôn ngữ này sang một ngôn ngữ khác thì ta sử dụng đoạn code sau: from googletrans import Translator translator = Translator() translated = translator.translate('svízelná situace', src='cs', dest='hu') print(translated.text) Trong đó:
Ngoài ra bạn cũng có thể truyền danh sách nhiều text cần dịch bằng cách đặt nó vào một mảng. from googletrans import Translator translator = Translator() data = ['Dobrý deň', 'majestátny orol', 'krehká dohoda'] translated = translator.translate(data, src='sk', dest='en') for trans in translated: print(f'{trans.origin} -> {trans.text}') Trên là cách sử dụng module Google Translator trong Python. Bạn có thể tham khảo thêm nội dung trên trang chủ của Python pip nhé. |