programming python

Bạn có thể tạo bot bằng Python không?

Web Scraping là một quá trình trích xuất dữ liệu từ các trang web. Bot là một đoạn mã sẽ tự động hóa nhiệm vụ của chúng tôi. Do đó, bot quét web là một chương trình sẽ tự động quét một trang web để lấy dữ liệu, dựa trên các yêu cầu của chúng tôi.

mô-đun cần thiết

bs4. Beautiful Soup[bs4] là một thư viện Python để lấy dữ liệu ra khỏi các tệp HTML và XML. Mô-đun này không được tích hợp sẵn với Python. Để cài đặt loại này, lệnh dưới đây trong thiết bị đầu cuối

cài đặt pip bs4

yêu cầu. Yêu cầu cho phép bạn gửi HTTP/1. 1 yêu cầu cực kỳ dễ dàng. Mô-đun này cũng không tích hợp sẵn với Python. Để cài đặt loại này, lệnh dưới đây trong thiết bị đầu cuối

yêu cầu cài đặt pip

selen. Selenium là một trong những công cụ kiểm thử tự động phổ biến nhất. Nó có thể được sử dụng để tự động hóa các trình duyệt như Chrome, Firefox, Safari, v.v.

cài đặt selen

Phương pháp 1. Sử dụng Selenium

Chúng tôi cần cài đặt trình điều khiển chrome để tự động hóa bằng selen, nhiệm vụ của chúng tôi là tạo một bot sẽ liên tục quét trang web tin tức google và hiển thị tất cả các tiêu đề cứ sau 10 phút

Triển khai từng bước

Bước 1. Trước tiên, chúng tôi sẽ nhập một số mô-đun cần thiết

Python3

# These are the imports to be made

import time

from seleniumimport webdriver

from datetimeimport datetime

Bước 2. Bước tiếp theo là mở trang web cần thiết

Python3

import1

import2import3 import4import5

import6import3 import8import9

time0

time1

time2import3 time4

time0

time6

time7

đầu ra

Bước 3. Trích xuất tiêu đề tin tức từ trang web, để trích xuất một phần cụ thể của trang, chúng tôi cần XPath của nó, có thể truy cập phần này bằng cách nhấp chuột phải vào phần tử được yêu cầu và chọn Kiểm tra trong thanh thả xuống.

Sau khi nhấn Inspect một cửa sổ hiện ra. Từ đó, chúng ta phải sao chép các phần tử XPath đầy đủ để truy cập nó

Ghi chú. Bạn có thể không phải lúc nào cũng nhận được chính xác phần tử mà bạn muốn bằng cách kiểm tra [tùy thuộc vào cấu trúc của trang web], vì vậy bạn có thể phải lướt mã HTML một lúc để có được phần tử chính xác mà bạn muốn. Và bây giờ, chỉ cần sao chép đường dẫn đó và dán vào mã của bạn. Sau khi chạy tất cả các dòng mã này, bạn sẽ nhận được tiêu đề của tiêu đề đầu tiên được in trên thiết bị đầu cuối của mình

Python3

time8

time9import3 from1from2from3from2from5from2from7from8from9from2selenium1from2selenium3selenium4selenium5_______3_______2_______4_______3_______1_______4_______4_______2_______1

selenium1from2import4from2from7from8from9from2selenium3webdriver1selenium5from2selenium3webdriver5selenium5from2selenium1from2selenium1from2from2from2from4from2from6

time0

from8

from9import3 datetime1

time0

datetime3

datetime4_______8_______5

đầu ra

‘Tấn công vào lãnh thổ Afghanistan’. Taliban trong cuộc không kích của Hoa Kỳ đã giết chết 2 người đàn ông ISIS-K

Bước 4. Bây giờ, mục tiêu là lấy X_Path của tất cả các tiêu đề hiện có.

Một cách là chúng tôi có thể sao chép tất cả XPath của tất cả các tiêu đề [khoảng 6 tiêu đề sẽ có trong tin tức trên google mỗi lần] và chúng tôi có thể tìm nạp tất cả những tiêu đề đó, nhưng phương pháp đó không phù hợp nếu có nhiều thứ cần . Vì vậy, cách tinh tế là tìm mẫu XPath của các tiêu đề sẽ giúp các tác vụ của chúng ta trở nên dễ dàng và hiệu quả hơn. Dưới đây là XPath của tất cả các tiêu đề trên trang web và hãy tìm ra mẫu

/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[3]/div/div/article/h3/a
/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[4]/div/div/article/h3/a
/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[5]/div/div/article/h3/a
/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[6]/div/div/article/h3/a
/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[7]/div/div/article/h3/a
/html/body/c-wiz/div/div[2]/div[2]/div/main/c-wiz/div[1]/div[8]/div/div/article/h3/a

Vì vậy, bằng cách xem các XPath này, chúng ta có thể thấy rằng chỉ có div thứ 5 đang thay đổi [những cái được in đậm]. Vì vậy, dựa trên điều này, chúng tôi có thể tạo XPath của tất cả các tiêu đề. Chúng tôi sẽ nhận được tất cả các tiêu đề từ trang bằng cách truy cập chúng bằng XPath của họ. Vì vậy, để trích xuất tất cả những thứ này, chúng tôi có mã là

Python3

datetime6

from7import3 webdriver1

import0 import1import2 import3import4webdriver5import6import7import8

import9datetime4_______1_______01import02import03

import9from7import06import3 webdriver1

import9import10import3 import12from2from3from2from5from2from7from8from9from2selenium1from2selenium3selenium4selenium5from2selenium3selenium4selenium5from2selenium1from2import34

import9from2from7from8_______3_______9from2selenium3webdriver1selenium5from2import45from2selenium1from2selenium1from2__from2_______3_______2_______3_______4_______3_______2_______3_______6

import9import57import3 import59

import9datetime4import62

đầu ra

Bây giờ, mã gần như đã hoàn tất, điều cuối cùng chúng ta phải làm là mã sẽ nhận được tiêu đề sau mỗi 10 phút. Vì vậy, chúng tôi sẽ chạy một vòng lặp và ngủ trong 10 phút sau khi nhận được tất cả các tiêu đề

Dưới đây là thực hiện đầy đủ

Python3

import time

from seleniumimport webdriver

from datetimeimport datetime

time0

import2import3 import4import5

time0

import6import3 import81

time0

time2import3 time4

time0

import87

time0

import89import4import91import8

import9import94import3 import96

import97

import9import99

import9time01

import9time03import3 time05time06import03

import9datetime4_______1_______01time11_______1_______03

import9from7import3 webdriver1

time0

import9import0 import1import2 import3import4webdriver5import6import7import8

time28import10import3 time31

time32

time28time34

time28time36

time28time38time39

time40_______1_______10import3 import12from2from3from1from5from2from7from8from9from2_______4_______1from2selenium3__selenium4_______4_______5_______3_______2_______4_______3_______ 4_______1

time40_______4_______1from2import4from2from7from8from9__from2selenium3selenium1selenium5from2_______1_______45from2selenium1from2__selenium1_______3_______2_______3_______2_______3_______2_______3_______2_______3_______2_______3_______2

time40_______1_______57import3 import59

time28time93time39

time40_______2_______96

time28datetime4import01import02import03

time28from7import06import3 webdriver1

time28datetime4import62

time32

import9from12

import9from14from15from16

đầu ra

https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210902223708/new-bot-video. mp4

Phương pháp 2. Sử dụng Yêu cầu và BeautifulSoup

Mô-đun yêu cầu lấy dữ liệu HTML thô từ các trang web và súp đẹp mắt được sử dụng để phân tích thông tin đó một cách rõ ràng để có được dữ liệu chính xác mà chúng tôi yêu cầu. Không giống như Selenium, không cần cài đặt trình duyệt và nó thậm chí còn nhẹ hơn vì nó truy cập trực tiếp vào web mà không cần sự trợ giúp của trình duyệt

Triển khai từng bước

Bước 1. Nhập mô-đun

Python3

import from18

from from20import from22

import time

Bước 2. Điều tiếp theo cần làm là lấy dữ liệu URL và sau đó phân tích cú pháp mã HTML

Python3

time2import3 from27

from28import3 from30

from31import3 from33

from34import3 from36from37_______1_______03

Bước 3. Đầu tiên, chúng ta sẽ lấy tất cả các tiêu đề từ bảng

Python3

from39

from40_______1_______3 from42from43from44from45selenium5

from47_______1_______3 from49from50

time0

import0 import1import2 from55

import9from57

from58

from47_______1_______3 from61from62_______4_______5

time0

datetime4import4_______3_______67import03

import0 from70import2 from72

import9datetime4from75

đầu ra

Bước 4. Theo cách tương tự, tất cả các giá trị trong mỗi hàng có thể được lấy

Python3

from76

import0 import1import2 import3import4webdriver1import6from84import8

import9from87import3 from42from43from91

import9from7import3 from95_______3_______96import03

import97

import9import0 import1import2 selenium03

time28datetime4_______4_______06import3selenium08import03

import9datetime4selenium12

đầu ra

Dưới đây là thực hiện đầy đủ

Python3

import from18

from from20import from22

from datetimeimport datetime

import time

time0

import89import4import91import8

import9import94import3 import96

import97

import9selenium36

import9time01

import9time03import3 time05time06import03

import9datetime4_______1_______01time11_______1_______03

time0

import9from28import3 selenium54_______3_______27import03

import9from31_______1_______3 from33

import9selenium62import3 from36from37import03

import9from40import3 selenium70from43from44from45selenium5

import9from47import3 selenium78

import9import0 import1import2 from55

time28from57

import9from47import3 from61_______3_______62selenium5

time0

import9from34import3 selenium78

time0

import9import0 import1_______1_______2 import3import4webdriver1import6from84import8

time28import09import3 selenium70from43from91

time28import15import3 import17from96import03

time28import21 import3 import23

time32

time28import0 import27_______1_______2 import3import4from62import8

time40_______1_______21import35import3 import37

time28import39import21import03

time32

import9import0 import45import2 import47

time28datetime4import50

time28datetime4selenium12

import9from14from15import03

đầu ra

Lưu trữ Bot

Đây là một phương thức đặc thù, dùng để chạy bot liên tục trực tuyến mà không cần bất kỳ sự can thiệp nào của con người. thay thế. com là một trình biên dịch trực tuyến, nơi chúng tôi sẽ chạy mã. Chúng tôi sẽ tạo một máy chủ web nhỏ với sự trợ giúp của mô-đun bình trong python giúp chạy mã liên tục. Vui lòng tạo một tài khoản trên trang web đó và tạo một thay thế mới

Sau khi tạo thay thế, Tạo hai tệp, một tệp để chạy mã bot và tệp còn lại để tạo máy chủ web bằng bình

Mã cho cryptotracker. py

Python3

import from18

from from20import from22

from datetimeimport datetime

import time

time0

import71

import72

from import74import import74

import import78

time0

import80

import81

import89import4import91import8

import9import87import3 import89import90import03

import9import93import3 import95

import97

import9import98

import9time03import3 webdriver02webdriver03import03

import9datetime4_______1_______01time11_______1_______03

time0

import9from28import3 selenium54_______3_______27import03

import9from31_______1_______3 from33

import9selenium62import3 from36from37import03

time0

import9from40import3 selenium70from43from44from45selenium5

import9from47import3 selenium78

import9import0 import1import2 from55

time28from57

import9from47import3 from61_______3_______62selenium5

time0

import9from34import3 selenium78

time0

import9import0 import1_______1_______2 import3import4webdriver1import6from84import8

time28import09import3 selenium70from43from91

time28import15import3 import17from96import03

time28import21 import3 import23

time28import0 import27_______1_______2 import3import4from62import8

time40_______1_______21import35import3 import37

time28import39import21import03

time0

import9import0 import45import2 import47

time28datetime4import50

time0

import9from14from14import03

Mã cho keep_alive. py [máy chủ web]

Python3

from from17import from19

from from21_______1_______ from23

time0

from25import3 from27

time0

from29_______3_______30from31import03

from33 from34

import9from36 from37

time0

from33 from40

from41from42import3from44from45import3from47import03

time0

from33 from51

import9from53import3 from55_______1_______3from57

import9from59

Keep-alive là một phương pháp trong mạng được sử dụng để ngăn chặn một liên kết nào đó bị phá vỡ. Ở đây, mục đích của mã duy trì là tạo một máy chủ web bằng cách sử dụng bình, điều này sẽ giữ cho chuỗi mã [mã theo dõi tiền điện tử] hoạt động để nó có thể cung cấp các bản cập nhật liên tục

Bây giờ, chúng tôi đã tạo một máy chủ web và bây giờ, chúng tôi cần một cái gì đó để ping nó liên tục để máy chủ không bị hỏng và mã tiếp tục chạy liên tục. Có một trang web uptimerobot. com làm công việc này. Tạo một tài khoản trong đó

https. //phương tiện truyền thông. chuyên viên máy tính. org/wp-content/uploads/20210902225131/replit-gfg-crypto-bot. mp4

Chạy mã theo dõi tiền điện tử trong Replit. Do đó, chúng tôi đã tạo thành công một bot quét web sẽ liên tục loại bỏ trang web cụ thể cứ sau 10 phút và in dữ liệu ra thiết bị đầu cuối

Python có tốt để tạo bot không?

Có, Python có thể là một lựa chọn tuyệt vời để xây dựng chatbot vì thư viện Chatterbox của nó, được phát triển bằng cách sử dụng máy học, với công cụ đào tạo tích hợp và luồng đối thoại trò chuyện.

Các bot có được tạo bằng Python không?

Tài nguyên bot dành riêng cho Python . Bot trò chuyện với người dùng khi hệ thống phụ trợ phát hiện hành vi lạ trên một trong các tài khoản của họ để kiểm tra xem có vi phạm bảo mật hay không. Dropbox open sourced their security Slack bot, which is built in Python. The bot converses with a user when backend systems detect strange behavior on one of their accounts to check if there has been a security breach.

Python có thể tạo bot Discord không?

Vì bạn đang học cách tạo bot Discord bằng Python nên bạn sẽ sử dụng discord. p . bất hòa. py là một thư viện Python triển khai triệt để các API của Discord theo cách hiệu quả và đậm chất Pythonic. Điều này bao gồm việc sử dụng triển khai Async IO của Python.

Làm cách nào để tạo AI bằng Python?

Trăn AI. Cách xây dựng mạng nơ-ron và đưa ra dự đoán .

Tính toán lỗi dự đoán

Hiểu cách giảm lỗi

Áp dụng quy tắc chuỗi

Điều chỉnh các tham số bằng Backpropagation

Tạo lớp mạng thần kinh

Đào tạo mạng với nhiều dữ liệu hơn

Thêm nhiều lớp hơn vào mạng lưới thần kinh

mô-đun cần thiết

Phương pháp 1. Sử dụng Selenium

Triển khai từng bước

Python3

Python3

Python3

Python3

Python3

Phương pháp 2. Sử dụng Yêu cầu và BeautifulSoup

Triển khai từng bước

Python3

Python3

Python3

Python3

Python3

Lưu trữ Bot

Python3

Python3

Python có tốt để tạo bot không?

Các bot có được tạo bằng Python không?

Python có thể tạo bot Discord không?

Làm cách nào để tạo AI bằng Python?

Bài Viết Liên Quan

Toplist mới

Bài mới nhất

Chủ Đề