Trong các kịch bản dữ liệu lớn, đôi khi chúng tôi sử dụng MySQL làm cơ sở dữ liệu quan hệ để lưu trữ dữ liệu giao dịch và Sqoop dữ liệu vào môi trường dựa trên HDFS để phân tích sâu hơn nhằm hiểu rõ hơn về doanh nghiệp từ dữ liệu. Chúng tôi tương tác với cơ sở dữ liệu mysql để lưu trữ và truy xuất dữ liệu, đôi khi chúng tôi tạo các bảng thông qua các tệp csv
Yêu cầu hệ thống
- Cài đặt mô-đun python pydrive như sau
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
2CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
3CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
4- Liên kết để cài đặt cơ sở dữ liệu bàn làm việc mysql. bấm vào đây
- Các mã dưới đây có thể được chạy trong sổ ghi chép Jupyter hoặc bất kỳ bảng điều khiển python nào
Bước 1. Chuẩn bị tệp CSV
Để bắt đầu, hãy chuẩn bị tệp CSV mà bạn muốn nhập vào MySQL. Ví dụ: tôi đã chuẩn bị một tệp CSV đơn giản với dữ liệu sau
Bạn có thể kết nối cơ sở dữ liệu của mình bằng cách thực hiện lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];0 và cung cấp mật khẩu
Xin lưu ý rằng cả Máy khách dòng lệnh MySQL và công cụ dòng lệnh tiêu chuẩn đều cung cấp dấu nhắc mysql giống nhau
Nhập tệp CSV
Trước khi nhập tệp CSV, bạn cần tạo bảng theo cách thủ công với các loại dữ liệu phù hợp cho từng cột
Vì vậy, trước tiên hãy tạo một lược đồ mới bằng cách sử dụng lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];1. Sau đó, chúng tôi sẽ thực thi lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];2 để đảm bảo rằng bạn đang ở trong lược đồ mới tạo của mình. Cuối cùng, chúng ta sẽ tạo một bảng mới bằng lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];3
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
Lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];1 theo sau bởi một tên lược đồ sẽ tạo một lược đồ mới có tên là
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];5. Và lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];2 theo sau là tên lược đồ đảm bảo rằng chúng tôi làm việc bên trong lược đồ mới được tạo. Sau khi hoàn thành những điều này, chúng ta tạo một bảng mới bằng lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];3
Bây giờ chúng tôi có thể tải bảng
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];8 với dữ liệu từ tệp CSV của chúng tôi
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];1
Lệnh này chỉ định như sau
- Tệp mà dữ liệu được tải từ đó.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
9 - Bảng mà dữ liệu được tải vào. Tôi____110
- Ký tự ngăn cách các giá trị.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
11
Xin lưu ý rằng nếu bạn sử dụng dấu phân cách khác, chẳng hạn như dấu chấm phẩy hoặc tab, bạn nên cập nhật dòng này để bao gồm ký tự phân tách của mình.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];12 hoặc F
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];13
- Nếu một số hoặc tất cả các giá trị được đặt trong dấu ngoặc kép, hãy bao gồm dòng này.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
14 - Ký tự kết thúc các dòng.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
15 - Thông tin để bỏ qua hàng đầu tiên chứa tiêu đề.
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
16
Đây là đầu ra bàn điều khiển của tất cả các lệnh
Hãy xác minh quy trình nhập bằng cách thực hiện câu lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];17
Dòng lệnh trả về một tập dữ liệu phù hợp, mặc dù định dạng có thể bị gián đoạn
Hãy xác minh điều tương tự bằng giao diện GUI
Bây giờ chúng tôi chắc chắn rằng quá trình nhập đã thành công
Hãy xem cách thực hiện tương tự bằng GUI
Sử dụng GUI MySQL
Chúng tôi sẽ sử dụng MySQL Workbench, một trong những GUI phổ biến nhất cho MySQL. Thực hiện theo các bước bên dưới để nhập tệp CSV vào cơ sở dữ liệu MySQL thông qua Giao diện người dùng đồ họa
Kết nối cơ sở dữ liệu
Trong MySQL Workbench, bạn có thể kết nối với bất kỳ cơ sở dữ liệu nào bằng cách nhấp vào dấu + bên cạnh Kết nối MySQL trên trang chủ. Một cửa sổ bật lên yêu cầu bạn cung cấp chi tiết kết nối, chẳng hạn như tên kết nối, phương thức kết nối, tên máy chủ, cổng, tên người dùng và mật khẩu
Bây giờ, hãy kiểm tra kết nối của bạn bằng cách nhấp vào nút Kiểm tra kết nối. Cung cấp mật khẩu và khi kiểm tra thành công, bạn sẽ nhận được thông báo này
Đóng cả hai cửa sổ bằng cách nhấp vào nút OK. Bây giờ chúng tôi có thể tiến hành nhập tệp CSV
Nhập tệp CSV
Khi bạn sử dụng GUI, bạn không cần tạo bảng trước khi nhập tệp CSV
Bước đầu tiên là tạo một lược đồ mới [nếu bạn muốn sử dụng lược đồ mới thay vì lược đồ hiện có]. Bạn có thể làm điều đó theo hai cách
- Chạy lệnh
CREATE SCHEMA data; USE data; CREATE TABLE `countries` [ `id` int DEFAULT NULL, `country` text, `population` text, `capital` text];
1 trong cửa sổ truy vấn. - Tạo lược đồ từ giao diện GUI.
Sau đó, nhấp chuột phải vào Bảng bên dưới tên lược đồ và chọn tùy chọn Trình hướng dẫn nhập dữ liệu bảng
Một cửa sổ bật lên sẽ hướng dẫn bạn quy trình nhập
Bây giờ, chọn tệp CSV mà bạn muốn nhập và nhấp vào Tiếp theo
Bạn có thể sử dụng bảng hiện có [tùy chọn này yêu cầu bạn tạo bảng trước quá trình nhập] hoặc tạo bảng mới. Ở đây, chúng tôi chọn tạo một bảng mới
MySQL Workbench phát hiện định dạng tệp và đề xuất kiểu dữ liệu mã hóa và cột sẽ được sử dụng. Bạn có thể tự do sửa đổi nó khi bạn thấy phù hợp, nhưng chúng tôi sẽ tiếp tục với các giá trị được đề xuất
Dưới đây là tóm tắt các nhiệm vụ sẽ được thực hiện
Và thế là xong
Khi nhấp vào nút Tiếp theo, bạn sẽ nhận được một báo cáo chi tiết
Bây giờ, chúng ta có thể đóng trình hướng dẫn bằng cách nhấp vào nút Kết thúc
Hãy xác minh sự thành công của quy trình nhập bằng cách truy vấn bảng mới tạo của chúng tôi
Chắc chắn rằng việc nhập tệp CSV bằng GUI sẽ nhanh hơn và ít cồng kềnh hơn so với nhập bằng dòng lệnh, nhưng cả hai đều nên biết
Để so sánh các quy trình nhập tệp CSV trên các công cụ cơ sở dữ liệu khác nhau, hãy đọc bài viết của chúng tôi về Cách nhập tệp CSV vào PostgreSQL bằng PgAdmin. Và để tìm hiểu về quy trình xuất, Cách xuất tệp CSV từ truy vấn T-SQL trình bày quy trình xuất tệp CSV trong công cụ cơ sở dữ liệu MS SQL Server
Hãy nhập một số tệp CSV
Các tệp CSV được sử dụng rộng rãi vì tính đơn giản của chúng. Bạn có thể tạo tệp CSV bằng trình soạn thảo văn bản đơn giản, chẳng hạn như Notepad. Các tệp CSV có thể sử dụng dấu chấm phẩy thay vì dấu phẩy hoặc đặt giá trị trong dấu ngoặc kép hoặc không
Như chúng ta đã thấy trong bài viết này, thật dễ dàng để nhập tệp CSV vào cơ sở dữ liệu MySQL. Bạn có thể sử dụng dòng lệnh hoặc GUI. Cách tốt nhất để cảm thấy thoải mái với một trong hai tùy chọn là thực hành, vì vậy hãy tiếp tục và thử ví dụ này và các ví dụ khác. Bạn cũng có thể sử dụng các khóa học MySQL tương tác của chúng tôi để tìm hiểu thêm về cơ sở dữ liệu này. Tại đây, bạn sẽ tìm thấy tổng quan về các khóa học về SQL của chúng tôi từ A đến Z trong theo dõi MySQL