Lệnh join trong linux
Bài viết này giới thiệu các bạn về cách dùng lệnh sort, uniq, paste, join, split trên hệ điều hành Linux. Khi quản lý tệp, chúng ta cần thực hiện nhiều tác vụ, như sắp xếp dữ liệu và sao chép dữ liệu từ vị trí này sang vị trí khác. Hệ điều hành Linux cung cấp một số tiện ích thao tác với tệp cho chúng ta sử dụng khi làm việc với các tệp văn bản. Trong bài viết này, chúng ta sẽ tìm hiểu về các thao tác với lệnh sau:
2. Lệnh sortLệnh
Để xem các tùy chọn của lệnh Lệnh
Kết hợp hai tệp, sau đó sắp xếp các dòng và hiển thị ra màng hình:
Ví dụ: Sắp xếp các dòng trong file.txt theo thứ tự a đến z và ngược lại
2. Lệnh uniqLệnh Lệnh Để xóa các mục trùng lặp khỏi nhiều tệp cùng một lúc, hãy sử dụng lệnh sau:
Hoặc
Để đếm số lượng mục trùng lặp, sử dụng lệnh sau:
Ví dụ: Lọc các dòng trùng lặp trong file.txt
Ví dụ: Đếm số lượng dòng trùng lặp trong file.txt
3. Lệnh pasteGiả sử chúng ta có tệp chứa tên đầy đủ của tất cả nhân viên và một tệp khác liệt kê số điện thoại và ID nhân viên của họ. Chúng ta muốn tạo một tệp mới chứa tất cả dữ liệu được liệt kê trong ba cột: tên, ID nhân viên và số điện thoại. Làm thế nào chúng ta có thể làm điều này một cách hiệu quả mà không cần đầu tư quá nhiều thời gian? Lệnh Ví dụ: Dấu phân cách có thể là khoảng trắng, tab hoặc Enter. Lệnh
Lệnh Ví dụ: Dòng một từ file1 có thể được kết hợp với dòng một của file2 , dòng hai từ file1 có thể được kết hợp với dòng hai của file2,... Để dán nội dung từ hai tệp chúng ta sử dụng cú pháp:
Cú pháp sử dụng dấu phân cách khác nhau như sau:
Các dấu phân cách phổ biến là 'dấu cách', 'tab', '|', 'dấu phẩy',... Ví dụ:
4. Lệnh joinGiả sử có hai tệp với một số cột tương tự. Chúng ta đã lưu số điện thoại của nhân viên trong hai tệp, một tệp có tên và một tệp có họ. Chúng ta muốn kết hợp các tệp mà không lặp lại dữ liệu của các cột. Làm thế nào để bạn đạt được điều này? Để thực hiện việc trên bằng cách sử dụng phép nối, về cơ bản là phiên bản nâng cao của lệnh Để kết hợp hai tệp trên một trường chung: Ví dụ:
4. Lệnh splitLệnh Để chia tệp thành các phân đoạn bằng cách sử dụng tiền tố, sử dụng lệnh: Chúng tôi sẽ áp dụng phân chia cho một tệp từ điển Mỹ-Anh gồm hơn 19.000 dòng:
Chúng ta sử dụng wc (đếm từ) để báo cáo về số lượng dòng trong tệp. Sau đó, gõ:
Cú pháp trên sẽ chia tệp american-english thành 100 phân đoạn có kích thước bằng nhau có tên 'xa*' . Phân đoạn cuối cùng tất nhiên sẽ là phần nhỏ hơn. |