Làm cách nào để lấy dữ liệu twitter từ python?

Bài đăng trên blog này sẽ chỉ cho bạn cách truy cập dữ liệu Twitter bằng Python. Tôi sẽ hướng dẫn bạn các bước cần thiết để bắt đầu và sau đó tôi sẽ chỉ cho bạn một số ví dụ về những gì bạn có thể làm với dữ liệu

Làm cách nào để lấy dữ liệu twitter từ python?

Pratik Sharma

17 tháng 7 năm 2022 — 5 phút đọc

Làm cách nào để lấy dữ liệu twitter từ python?
Các bước trích xuất dữ liệu Twitter bằng Tweepy (Python)

Bạn có muốn tìm hiểu cách truy cập dữ liệu Twitter bằng Python không? . Tôi sẽ hướng dẫn bạn các bước cần thiết để bắt đầu và sau đó tôi sẽ chỉ cho bạn một số ví dụ về những gì bạn có thể làm với dữ liệu. Twitter là một nguồn thông tin tuyệt vời và với Python, thật dễ dàng để trích xuất thông tin đó và sử dụng nó cho mục đích của bạn. Vậy hãy bắt đầu

Làm cách nào để đăng ký tài khoản Nhà phát triển Twitter?

Có một số bước cần thực hiện để đăng ký làm nhà phát triển trên trang web

điều kiện tiên quyết

Điều kiện tiên quyết trước khi bắt đầu với ứng dụng của tài khoản nhà phát triển Twitter

  1. Tài khoản Twitter 😉
  2. Địa chỉ email và số điện thoại đã được xác minh

Các bước chi tiết

Làm cách nào để lấy dữ liệu twitter từ python?
Biểu mẫu tài khoản nhà phát triển Twitter
  1. Đăng ký tài khoản nhà phát triển Twitter
  2. Trên màn hình tiếp theo, hãy điền một số chi tiết cơ bản về trường hợp sử dụng và quốc gia nơi bạn sinh sống
  3. Đồng ý với Thỏa thuận & chính sách dành cho nhà phát triển
  4. Khi đã xong, bạn sẽ nhận được email từ Twitter để xác minh ứng dụng tài khoản nhà phát triển

Bạn có thể kiểm tra một số câu hỏi thường gặp (FAQ) về quản lý tài khoản nhà phát triển, cấp truy cập và chức năng tại đây

Tạo Project và kết nối App

  • Thiết lập một dự án bằng liên kết này. Bạn sẽ được yêu cầu cung cấp tên dự án, trường hợp sử dụng (tương tự như những gì bạn đã làm khi đăng ký tài khoản nhà phát triển) và mô tả dự án
Làm cách nào để lấy dữ liệu twitter từ python?
Tạo Dự án trong Tài khoản Nhà phát triển Twitter
  • Khi bạn đã hoàn thành các bước trước đó, bạn cần tạo Ứng dụng tiếp theo. Nó sẽ nằm trong dự án bạn đã tạo ở bước trước. Quan trọng. tên của ứng dụng bạn đang tạo không được trùng lặp nếu không bạn có thể gặp lỗi
  • Trên màn hình tiếp theo, bạn sẽ thấy các khóa và mã thông báo tôi. e. Khóa API, Bí mật khóa API và Mã thông báo mang. Quan trọng. Vui lòng lưu những thứ này trên máy cục bộ của bạn, chúng tôi sẽ sử dụng cái này sau
  • Bây giờ, hãy thiết lập xác thực để đăng nhập vào ứng dụng bằng Twitter
Làm cách nào để lấy dữ liệu twitter từ python?
Cài đặt xác thực người dùng trong khi đăng ký Tài khoản nhà phát triển Twitter
  • Có hai loại phương thức xác thực, bạn có thể đọc chi tiết về chúng tại đây
  • Có ba loại quyền ứng dụng trên trang cài đặt xác thực người dùng. (i) Đọc, (ii) Đọc và viết (iii) Đọc và viết và nhắn tin trực tiếp. Tùy thuộc vào trường hợp sử dụng của bạn, vui lòng chọn quyền ứng dụng phù hợp trên trang Cài đặt xác thực người dùng
  • Vui lòng đọc về URL gọi lại
  • Khi bạn đã cung cấp URL gọi lại và trang web cho ứng dụng, tùy thuộc vào phương thức OAuth, bạn sẽ thấy
Làm cách nào để lấy dữ liệu twitter từ python?
Màn hình sau khi áp dụng cài đặt xác thực thành công nếu OAuth 1. 0a đã được chọn làm phương thức xác thực
  • Hãy nhớ rằng nếu bạn đã chọn OAuth 2. 0, bạn sẽ cần lưu trữ thông tin xác thực bổ sung ngoài những thông tin được tạo ở trên
Làm cách nào để lấy dữ liệu twitter từ python?
Màn hình sau khi áp dụng cài đặt xác thực thành công nếu OAuth 2. 0 đã được chọn làm phương thức xác thực
  • Bây giờ hãy tạo Access Token và Secret. Quan trọng. Vui lòng lưu những thứ này trên máy cục bộ của bạn, chúng tôi sẽ sử dụng cái này sau
Làm cách nào để lấy dữ liệu twitter từ python?
Nhấp vào nút Tạo bên cạnh Mã thông báo truy cập và Bí mật

Cấp độ truy cập API Twitter

Twitter API v2 bao gồm một vài cấp độ truy cập để giúp bạn mở rộng quy mô sử dụng của mình trên nền tảng. Nói chung, tài khoản mới có thể nhanh chóng đăng ký miễn phí, truy cập cần thiết. Nếu bạn muốn có thêm quyền truy cập, bạn có thể chọn đăng ký quyền truy cập Nâng cao miễn phí và hơn thế nữa. Để hiểu chi tiết về các loại cấp truy cập khác nhau, bạn có thể sử dụng

Tweepy là gì và cách cài đặt Tweepy?

Tweepy là một thư viện Python cho phép người dùng truy cập dữ liệu từ API của Twitter. Tweepy có thể được sử dụng cho nhiều mục đích khác nhau, chẳng hạn như lấy thông tin trên các tweet, lọc dữ liệu theo các từ khóa nhất định, v.v. Bạn có thể cài đặt Tweepy bằng cách sử dụng pip hoặc cài đặt trực tiếp từ kho lưu trữ GitHub

## using pip way
pip install Tweepy

## cloning from GitHub repo
pip install git+https://github.com/tweepy/tweepy.git

Sử dụng Tweepy để truy cập dữ liệu Twitter

Xin lưu ý rằng đối với các ví dụ được khám phá bên dưới, tôi sử dụng phương pháp “Truy cập nâng cao” và do đó có những hạn chế sau

  • Giới hạn dự án. 1 dự án
  • Giới hạn ứng dụng. 3 ứng dụng cho mỗi dự án
  • mũ Tweet. Truy xuất tới 2 triệu Tweet mỗi tháng

Xác thực ứng dụng

Chúng tôi sẽ sử dụng khóa API (khóa người tiêu dùng), bí mật khóa API (bí mật người tiêu dùng), mã thông báo mang, mã thông báo truy cập và bí mật mã thông báo truy cập được lưu trong các bước trước tại đây để xác thực ứng dụng bằng Tweepy

Phân tích Tweet

Rất nhiều có thể được thực hiện ở đây e. g. ẩn hoặc hiện câu trả lời cho một tweet, thích hoặc không thích một tweet, nhận danh sách người dùng đã thích một tweet, nhận các tweet đã thích của người dùng, tạo hoặc xóa một tweet, chuyển tiếp hoặc hủy chuyển tiếp một tweet, v.v. Chúng ta hãy xem từng cái một

Tạo một Tweet & Xóa nó

## Create Tweet
# Replace your tweet text instead of "Hey everyone!"
client.create_tweet(text = "Hey everyone!")

## Delete Tweet
# Replace the id of the tweet you want to delete
client.delete_tweet(1492601786842361856)
Tạo một Tweet và xóa nó

Tìm kiếm Tweet gần đây

Hãy cùng kiểm tra điểm cuối tìm kiếm các tweet gần đây, điểm cuối này trả về kết quả có giá trị trong bảy ngày phù hợp với truy vấn tìm kiếm được cung cấp. Giả sử chúng ta muốn kiểm tra các tweet gần đây có từ khóa = "#WellDoneẤn Độ", ngôn ngữ = "Tiếng Anh" và không phải là các tweet lại

Làm cách nào để lấy dữ liệu Twitter bằng Python?

Nhận tweet của người dùng . Tương tự như phương thức home_timeline(), phương thức này trả về 20 trạng thái gần đây nhất được đăng từ người dùng xác thực hoặc người dùng được chỉ định. Cũng có thể yêu cầu dòng thời gian của người dùng khác thông qua tham số id. using the user_timeline() method. Similar to the home_timeline() method, this method returns the 20 most recent statuses posted from the authenticating user or the user specified. It's also possible to request another user's timeline via the id parameter.

Tôi có thể thu thập dữ liệu từ Twitter không?

Bạn có thể sử dụng NCapture để lấy dữ liệu Twitter rồi nhập từ đó vào NVivo để phân tích . NVivo hỗ trợ phân tích cụm và mạng, lập bản đồ hoặc bạn có thể xem các tweet để viết mã. Một công cụ dựa trên Python được tạo riêng để làm việc với văn bản trên mạng xã hội.