Hướng dẫn can python replace excel - python có thể thay thế excel không
Nội dung chính ShowShow Show
Sử dụng gấu trúc và numpy để thay thế excel.Cái nào tốt hơn hoặc trăn?Làm thế nào để tôi thay đổi từ Excel sang Python? Python có dễ hơn excel không? Table of Contents Bộ dữ liệuMột sự thay thế tốt cho Excel là gì? Hình ảnh của tác giả (Made On Canva) import pandas as pd Là một người đã làm việc với Excel trong nhiều năm, tôi biết rằng ý tưởng học những điều bạn đã có thể làm trong Excel/VBA trong một môi trường hoàn toàn mới như Python không có vẻ thú vị. Tuy nhiên, tất cả những lợi ích mà môi trường Python cung cấp làm cho điều này xứng đáng. Vì lý do này, tôi đã đưa ra một hướng dẫn hữu ích và đơn giản mà tôi ước mình có khi tôi chuyển từ Excel sang Python. Trong bài viết này, chúng tôi sẽ sử dụng Python từ Pandas và Numpy Library để thay thế nhiều chức năng Excel mà bạn có thể đã sử dụng trong quá khứ.Trong hướng dẫn này, chúng tôi sẽ sử dụng một tệp Excel có định dạng .csv, thường được sử dụng khi làm việc với các bộ dữ liệu. Bộ dữ liệu bao gồm các nhãn hiệu được bảo mật bởi các sinh viên trong các môn học khác nhau và sẽ giúp chúng tôi dễ dàng chuyển từ bảng tính Excel sang các khung dữ liệu Python. Bạn có thể tải xuống dữ liệu này trên Kaggle hoặc trên GitHub của tôi (kiểm tra thư mục bộ dữ liệu). Để bắt đầu với hướng dẫn này, hãy để nhập các thư viện gấu trúc và numpy.Lưu ý: Nếu bạn không có các thư viện được cài đặt trong Python, bạn có thể dễ dàng cài đặt chúng bằng cách viết df_excel = pd.read_csv('StudentsPerformance.csv') 7 và df_excel = pd.read_csv('StudentsPerformance.csv') 8on thiết bị đầu cuối hoặc dấu nhắc lệnh của bạn.Với điều này, chúng ta có thể xem xét dữ liệu đầu tiên. Để làm như vậy, chúng tôi sử dụng Tổng, trung bình, tối đa, tối thiểu, đếmdf_excel = pd.read_csv('StudentsPerformance.csv') 9. Đảm bảo rằng CSV và tập lệnh Python của bạn được đặt ở cùng một nơi (cùng một đường dẫn).df_excel = pd.read_csv('StudentsPerformance.csv') Các cột (ví dụ: tổng một cột)Hàng (ví dụ: tổng một hàng) Thay thế nếu bằng NP. Ở đâuThay thế lồng nhau nếu bằng np.select Một điều kiện (chọn một cột có dấu ngoặc vuông []) Hai hoặc nhiều điều kiện (chọn cột và sử dụng & hoặc |)Làm sạch dữ liệu cơ bản import pandas as pd 3Hàng (ví dụ: tổng một hàng)Thay thế nếu bằng NP. Ở đâu import pandas as pd 4Thay thế lồng nhau nếu bằng np.select df_excel.describe() 5import pandas as pd 6Một điều kiện (chọn một cột có dấu ngoặc vuông []) Hai hoặc nhiều điều kiện (chọn cột và sử dụng & hoặc |)Làm sạch dữ liệu cơ bản Thay đổi trường hợp văn bản với .Str.Lower, .str.upper hoặc .str.title df_excel.describe() 8df_excel = pd.read_csv('StudentsPerformance.csv') 0NẾUChúng ta có thể dễ dàng thay thế Excel, nếu chức năng bằng cách sử dụng Numpy. Thay thế nếu bằng NP. Ở đâuHãy để tưởng tượng chúng tôi muốn biết liệu một học sinh đã vượt qua hay thất bại trong một bài kiểm tra và tạo một cột mới với thông tin đó. Chúng ta có thể dễ dàng làm điều đó với mã sau. df_excel = pd.read_csv('StudentsPerformance.csv') 1Như bạn có thể thấy df_excel.describe() 9 cần 3 đối số - điều kiện, giá trị nếu điều kiện là đúng và giá trị nếu điều kiện là sai.Thay thế lồng nhau nếu bằng np.selectHãy để tưởng tượng chúng tôi muốn cho các lớp từ A đến F dựa trên điểm số thu được. Trong trường hợp này, chúng tôi có nhiều hơn 2 giá trị, vì vậy chúng tôi sử dụng import pandas as pd 20import pandas as pd 21Needs to Đối số - Danh sách các điều kiện và danh sách các giá trị. Một danh sách trong Python được thể hiện bằng dấu ngoặc vuông import pandas as pd 22import pandas as pd 0Hãy nhớ rằng mỗi điều kiện nên nằm trong dấu ngoặc đơn. Bây giờ chúng tôi sử dụng phương thức df_excel = pd.read_csv('StudentsPerformance.csv') 73 và gán nó cho cột import pandas as pd 24 mới.Now we use the 3 và gán nó cho cột import pandas as pd 24 mới.Now we use the import pandas as pd 23 method and assign it to a new import pandas as pd 24 column.import pandas as pd 1Bây giờ 5 hàng đầu tiên đầu ra sẽ trông như thế này. Hình ảnh của tác giảĐiều này trông tương tự như bảng tính Excel, nhưng ở định dạng này, nó sẽ dễ dàng hơn để gây ra dữ liệu. Bây giờ tôi sẽ chỉ cho bạn trong Python cách thực hiện một số chức năng phổ biến mà bạn có thể đã sử dụng trong Excel. Tổng, trung bình, tối đa, tối thiểu, đếmCác chức năng phổ biến của Excel có thể dễ dàng thay thế bằng các phương pháp gấu trúc. Hãy để một cái nhìn. Một điều kiện (chọn một cột có dấu ngoặc vuông [])Hãy để tưởng tượng chúng ta muốn tổng số điểm cho giới tính nữ. Để làm như vậy, trước tiên, chúng tôi viết điều kiện import pandas as pd 28and sau đó. Chúng tôi chọn điều kiện đó bên trong khung df_excel.describe() 0 bằng cách sử dụng dấu ngoặc vuông import pandas as pd 22import pandas as pd 2Chúng tôi chỉ chọn giới tính nữ và đặt nó vào một khung dữ liệu được gọi là import pandas as pd 31. Bây giờ chúng tôi có thể thực hiện bất kỳ tính toán nào chúng tôi đã thấy trong phần Sum Sum, trung bình, tối đa, tối thiểu, đếm.Hai hoặc nhiều điều kiện (chọn cột và sử dụng & hoặc |)Nếu chúng ta có hai hoặc nhiều điều kiện, mã sẽ trông giống với quy định trên, nhưng với một số thay đổi. Hãy tưởng tượng chúng tôi muốn tính điểm số của nữ trong nhóm B import pandas as pd 32import pandas as pd 3Vì có 2 điều kiện chúng tôi có thể sử dụng & | đại diện và/hoặc tương ứng. Hãy nhớ rằng mỗi điều kiện nên nằm trong dấu ngoặc đơn.Keep in mind that each condition should be within parenthesis.Keep in mind that each condition should be within parenthesis. Bây giờ hãy để tổng hợp các điểm số. import pandas as pd 4Trong trường hợp này, tôi đã sử dụng import pandas as pd 33Method để chỉ cho bạn một cách khác để tạo một cột mới trong khi thực hiện các tính toán.Làm sạch dữ liệu cơ bảnChúng tôi sẽ kiểm tra một vài phương pháp được sử dụng để làm sạch dữ liệu. Trong trường hợp bạn muốn biết tất cả các phương pháp được sử dụng để làm sạch dữ liệu, hãy kiểm tra hướng dẫn đầy đủ tôi đã viết về cách làm sạch và chuẩn bị dữ liệu trong Python. Chúng tôi sẽ tiếp tục sử dụng khung df_excel.describe() 0 mà chúng tôi đã xác định trước đó.Thay đổi trường hợp văn bản với .Str.Lower, .str.upper hoặc .str.titleĐể truy cập các chuỗi có trong một cột, chúng tôi sử dụng import pandas as pd 35 thì chúng tôi có thể thay đổi trường hợp văn bản vớiimport pandas as pd 5Để lưu các giá trị, chúng ta có thể ghi đè một cột như trong mã bên dưới. import pandas as pd 6Nhưng trong trường hợp này, chúng tôi sẽ để lại các giá trị như vậy. Trích xuất văn bản trong một cột với .str.extractChúng ta có thể dễ dàng trích xuất văn bản từ một cột với import pandas as pd 36. Thêm vào đó, nếu chúng ta muốn trích xuất các mẫu cụ thể của một văn bản, chúng ta có thể sử dụng các biểu thức thông thường.Hãy để chúng tôi tưởng tượng chúng tôi chỉ muốn trích xuất các từ trong trường hợp trên trong cột import pandas as pd 37 (ví dụ: B B từ nhóm nhóm B B B). Để làm như vậy, chúng tôi viết mã sau.import pandas as pd 7Trong trường hợp này, chúng tôi đã sử dụng biểu thức thông thường import pandas as pd 38 ở đâu import pandas as pd 39 chỉ ra các từ trong trường hợp trên, trong khi dấu ngoặc đơn import pandas as pd 40is cần thiết để chọn mẫu mong muốn. Biểu thức thông thường có thể trông đáng sợ, nhưng chúng đơn giản hơn bạn nghĩ. Trong liên kết dưới đây, bạn sẽ tìm thấy một hướng dẫn đơn giản mà tôi đã thực hiện để dễ dàng tìm hiểu các biểu thức thông thường.Xác định xem một ô có trống với phương pháp .isnullĐể thay thế Excel, Counta, trong Python, chúng ta có thể sử dụng import pandas as pd 41 để tìm các giá trị trống.import pandas as pd 8Trong trường hợp này, không có giá trị trống nên kết quả sẽ là một khung dữ liệu trống. VlookupĐể tìm các yếu tố như Vlookup làm trong Excel, chúng tôi sẽ sử dụng import pandas as pd 42, import pandas as pd 43 hoặc import pandas as pd 44 dựa trên vấn đề chúng tôi muốn giải quyết.Chỉ cho những ví dụ này, chúng tôi sẽ làm việc với 2 bảng tính Excel. Đầu tiên là cùng một sinh viên của người Viking, chúng tôi đã làm việc cho đến nay, trong khi tệp thứ hai là tệp CSV có tên là LanguLAGESCORE, mà tôi đã tạo với ngẫu nhiên import pandas as pd 45 và import pandas as pd 46Values (bạn có thể tìm thấy tệp này trên github của tôi). Hãy cùng đọc cả hai tệp với import pandas as pd 47As mà chúng tôi đã làm trước đây.values (you can find this file on my Github). Let’s read both files with import pandas as pd 47as we did before.import pandas as pd 9values (you can find this file on my Github). Let’s read both files with import pandas as pd 47as we did before.import pandas as pd 9Bây giờ, chúng tôi sẽ tạo một cột import pandas as pd 45 trên import pandas as pd 49 vì vậy nó có một cột chung với import pandas as pd 60. Để làm như vậy, chúng tôi chạy mã sau.df_excel = pd.read_csv('StudentsPerformance.csv') 0Như bạn có thể thấy, tôi đã tạo một cột import pandas as pd 45 dựa trên chỉ mục. import pandas as pd 62gets thoát khỏi chỉ mục bằng cách thêm nó làm cột. Bạn có thể bỏ chỉ mục thực hiện import pandas as pd 63But Trong trường hợp này, tôi sẽ đổi tên cột import pandas as pd 64 mới này bằng cách sử dụng phương thức import pandas as pd 65. Với điều này, chúng tôi có một cột import pandas as pd 45 mới.Tìm một phần tử với .loc []Tìm một phần tử sử dụng gấu trúc cũng dễ như viết import pandas as pd 67 bên trong import pandas as pd 68 Chúng tôi phải bao gồm nhãn hàng và nhãn. Ler Ler tìm thấy thông tin liên quan đến hàng 100.df_excel = pd.read_csv('StudentsPerformance.csv') 1Chúng tôi cũng có thể đặt điều kiện. Ví dụ: chúng tôi muốn có được điểm toán cho học sinh với import pandas as pd 4 5 bằng 100.df_excel = pd.read_csv('StudentsPerformance.csv') 2Điều này có nghĩa là học sinh với df_excel = pd.read_csv('StudentsPerformance.csv') 00100 có điểm df_excel = pd.read_csv('StudentsPerformance.csv') 01 trong toán học.Hợp nhất hai bảng với pd.merge hoặc pd.concatHãy để tưởng tượng bạn muốn thêm điểm ngôn ngữ của tất cả các sinh viên đã làm bài kiểm tra. Trong trường hợp này, chúng tôi sử dụng df_excel = pd.read_csv('StudentsPerformance.csv') 02. Điều này yêu cầu 2 bảng có 1 cột chung. Trong trường hợp này, cột này là cột import pandas as pd 45.df_excel = pd.read_csv('StudentsPerformance.csv') 3Trên đây, bạn có thể thấy rằng một đối số khác là cần thiết df_excel = pd.read_csv('StudentsPerformance.csv') 04. Điều này cho biết cách hợp nhất được thực hiện. Trái và phải sẽ có ____85 và import pandas as pd 60 làm tài liệu tham khảo cho kết quả cuối cùng, trong khi df_excel = pd.read_csv('StudentsPerformance.csv') 07 sẽ chỉ cung cấp dữ liệu chung bên trong cột import pandas as pd 45.Bạn cũng có thể sử dụng df_excel = pd.read_csv('StudentsPerformance.csv') 09 cho cùng mục đích, nhưng bạn phải đặt import pandas as pd 45 làm chỉ mục trước khi kết hợp các khung hình và bao gồm các khung làm danh sách (trong ngoặc df_excel = pd.read_csv('StudentsPerformance.csv') 11)df_excel = pd.read_csv('StudentsPerformance.csv') 4Tất cả các giá trị không phù hợp với nhau sẽ nhận được NAN, nhưng chúng tôi có thể thay thế nó bằng bất kỳ giá trị nào bằng cách sử dụng phương thức ____92. Bàn xoaySử dụng phương thức .Pivot_TablePhương pháp pivot_table pivot_table hoạt động tương tự như phương pháp bạn tìm thấy trong Excel. Hãy để tưởng tượng chúng tôi muốn có được điểm toán và viết của tất cả các nhóm bên trong df_excel = pd.read_csv('StudentsPerformance.csv') 13Column.df_excel = pd.read_csv('StudentsPerformance.csv') 5Đối số import pandas as pd 64 sẽ nhóm df_excel = pd.read_csv('StudentsPerformance.csv') 15Column, trong khi đối số df_excel = pd.read_csv('StudentsPerformance.csv') 16 sẽ lấy các giá trị số để hiển thị. Cuối cùng, các tính toán được thực hiện bởi df_excel = pd.read_csv('StudentsPerformance.csv') 17. Trong trường hợp này, chúng tôi chọn giá trị trung bình .________ 98AS Một kết quả, chúng tôi có được bảng trục sau.Hình ảnh của tác giảThay thế đồ thị excel bằng python từ matplotlib hoặc seebornPython chứa các thư viện khác nhau để làm cho trực quan hóa tốt như những ưu đãi Excel. Hãy để Lừa làm cho một Barplot đơn giản dựa trên kết quả của df_excel = pd.read_csv('StudentsPerformance.csv') 19we được tạo ra ở trên. Đầu tiên, chúng tôi nhập import pandas as pd 00 và sau đó chúng tôi sử dụng import pandas as pd 01df_excel = pd.read_csv('StudentsPerformance.csv') 6Đối số đầu tiên của import pandas as pd 02is nhãn và thứ hai là giá trị số. Sau đó, chúng tôi hiển thị kết quả với import pandas as pd 03Hình ảnh của tác giảThay thế đồ thị excel bằng python từ matplotlib hoặc seeborn Python chứa các thư viện khác nhau để làm cho trực quan hóa tốt như những ưu đãi Excel.Hãy để Lừa làm cho một Barplot đơn giản dựa trên kết quả của df_excel = pd.read_csv('StudentsPerformance.csv')df_excel19we được tạo ra ở trên. Đầu tiên, chúng tôi nhập import pandas as pdimport numpy as np00 và sau đó chúng tôi sử dụng import pandas as pdimport numpy as np01df_excel = pd.read_csv('StudentsPerformance.csv')df_excel6Đối số đầu tiên của . import pandas as pd 02is nhãn và thứ hai là giá trị số. Sau đó, chúng tôi hiển thị kết quả với import pandas as pd 03Hình ảnh của tác giảCái nào tốt hơn hoặc trăn? Python có thể mở rộng quy mô khi nói đến nhiều nguồn dữ liệu. Trong khi Excel là cả kho lưu trữ dữ liệu và công cụ tính toán, Python hoàn toàn không liên quan đến dữ liệu. Vì Python có rất nhiều thư viện tuyệt vời, nên việc đọc dữ liệu từ nhiều nguồn như CSV, Excel, JSON và SQL là tầm thường. Làm thế nào để tôi thay đổi từ Excel sang Python? Trong bài viết này, chúng tôi sẽ thay đổi giá trị trong bảng tính Excel bằng Python ... Mở tệp Excel .. Tạo một bản sao có thể ghi của tệp Excel đã mở ..Đọc tờ đầu tiên để viết trong bản sao có thể ghi ..Excel is much easier to get started in and is much more user friendly, despite the handful of free tools out there meant to make Python easy to learn. Sửa đổi giá trị tại vị trí mong muốn ..Trên hết, những lựa chọn thay thế cho Excel là miễn phí .... Google Sheets.Hình ảnh: Google..... Tấm zoho.Hình ảnh: Tờ Zoho..... Microsoft Office Excel trực tuyến.Hình ảnh: ... . Apache OpenOffice Calc.Hình ảnh: Apache..... LibreOffice calc.Hình ảnh: Quỹ tài liệu..... Bảng tính văn phòng WPS.Hình ảnh: Phần mềm WPS Office .. |