Mẫu siêu dữ liệu Excel

Mẫu này được thiết kế để cung cấp phiên bản PBCore đơn giản nhất cho mục đích kiểm kê. Nó chứa các yếu tố và thuộc tính được sử dụng phổ biến nhất, với sự lặp lại tối thiểu. Mẫu bao gồm các từ vựng được kiểm soát trên tab thứ hai và trang “Trợ giúp” trên tab thứ ba cung cấp hướng dẫn về cách tùy chỉnh mẫu bằng cách lặp lại các trường và mở rộng các từ vựng được kiểm soát. Không thể sử dụng mẫu này với Công cụ biên mục PBCore

Mẫu siêu dữ liệu Excel
Mẫu bảng tính PBCore đầy đủ - Đã thu gọn

Mẫu này giống với Mẫu bảng tính biên mục PBCore đầy đủ, nhưng hầu hết các trường phần tử và trường thuộc tính lặp lại đều được thu gọn và ẩn khỏi chế độ xem của người dùng để có trải nghiệm đơn giản hơn. Các trường phần tử và thuộc tính lặp lại này có thể được mở rộng lại bằng khả năng “bỏ ẩn” của Excel. Để sử dụng mẫu này với Công cụ biên mục PBCore, hãy mở rộng lại tất cả các yếu tố sau khi kiểm kê xong, sau đó lưu dưới dạng tệp CSV

Mẫu siêu dữ liệu Excel
Mẫu bảng tính PBCore đầy đủ - Đã mở rộng

Mẫu này đại diện cho PBCore ở mức tối đa có thể ở định dạng bảng tính phẳng, bao gồm nhiều lần lặp lại của từng phần tử có thể lặp lại và tất cả các thuộc tính có thể. Bảng tính có các thành phần và thuộc tính được liệt kê trên tab đầu tiên và các từ vựng do PBCore kiểm soát được liệt kê trên tab thứ hai. Mẫu này được thiết kế để sử dụng với Công cụ biên mục PBCore, khi được lưu dưới dạng tệp CSV

Mẫu siêu dữ liệu Excel
Mẫu bảng tính hàng tồn kho nhiều khởi tạo

Mẫu này được thiết kế để tạo khoảng không quảng cáo có thể bao gồm nhiều bản sao của cùng một nội dung. Sheet đầu tiên ghi thông tin về từng khởi tạo, sheet thứ hai ghi thông tin Nội dung trí tuệ. Các Bản khởi tạo có thể được liên kết với Tài sản của chúng bằng cột khóa ngoại trên mỗi trang tính

Trước khi bắt đầu dự án hoặc thử nghiệm của bạn, hãy xem xét kho lưu trữ nào có thể phù hợp để xuất bản bộ dữ liệu của bạn. Đối với dữ liệu sinh học phân tử trong Khoa học đời sống, Trình hướng dẫn gửi dữ liệu EMBL-EBI sẽ hướng dẫn bạn đến kho lưu trữ phù hợp cho dữ liệu của bạn bằng một vài bước đơn giản

Sau khi bạn đã tìm thấy kho lưu trữ thích hợp cho dữ liệu của mình, hãy kiểm tra xem có cần lược đồ siêu dữ liệu hay không và tải xuống hoặc ghi lại các trường siêu dữ liệu bắt buộc của danh sách kiểm tra hoặc ít nhất là những trường bắt buộc. Nếu kho lưu trữ không yêu cầu siêu dữ liệu chuẩn cụ thể, bạn có thể chọn siêu dữ liệu chung và/hoặc chuyên ngành cụ thể cho tập dữ liệu của mình. Ví dụ, bạn cũng có thể sử dụng nhiều hơn một danh sách kiểm tra để mô tả tập dữ liệu đa ngành

Một cách dễ dàng để áp dụng siêu dữ liệu cho tập dữ liệu của bạn là sử dụng bảng tính (chẳng hạn như Excel và Google Trang tính). Excel và Google Trang tính là một cách đơn giản để tạo danh sách kiểm tra siêu dữ liệu với danh sách thả xuống từ vựng được kiểm soát (xác thực dữ liệu trong Excel và Google Trang tính). Trong thực tế, bạn có thể đặt các trường thuộc tính hoặc siêu dữ liệu trong các cột và có một hàng giá trị hoặc mô tả cho mỗi phép đo. Hàng trên cùng với các trường siêu dữ liệu có thể được bảo vệ chống ghi (bảo vệ ô trong Excel và Google Trang tính và cố định để luôn hiển thị (cố định hàng/cột trong Excel và Google Trang tính)

Cân nhắc việc có hai loại thông tin trong bảng tính siêu dữ liệu hoặc sách mã

  • Thông tin chung về nghiên cứu tổng thể của bạn, chứa các trường siêu dữ liệu như “Tên nghiên cứu”, “Mô tả nghiên cứu”, “Yếu tố thực nghiệm”, “Thiết kế nghiên cứu”, v.v.
  • Mô tả các quan sát và phép đo riêng lẻ, chứa các trường siêu dữ liệu dưới dạng tên cột, chẳng hạn như “Sao chép N”, “Ngày”, “Độ dài”, “Tên tệp dữ liệu”, v.v.

Cũng có thể sử dụng tệp README để mô tả các trường siêu dữ liệu về nghiên cứu tổng thể và xác định các từ vựng được kiểm soát cho các thuộc tính trong các cột. Để tránh nhầm lẫn trong việc giải thích giá trị của các trường siêu dữ liệu, bạn phải luôn có định nghĩa và phạm vi chính xác của các trường siêu dữ liệu đã sử dụng của mình. Nếu bạn sử dụng siêu dữ liệu tiêu chuẩn, bạn có thể tham khảo các định nghĩa của tiêu chuẩn, thay vì phải tự mô tả các trường siêu dữ liệu. Ví dụ: không phải ai cũng tự động hiểu rằng 'chiều dài' mô tả độ cao của một đối tượng hoặc cách đo lường đối tượng đó.

Mẫu siêu dữ liệu Excel

Hình 1. Mô tả trường siêu dữ liệu và từ vựng được kiểm soát

Thông thường, một bảng dữ liệu (siêu dữ liệu) chứa 30 thuộc tính trở lên để mô tả dữ liệu ở cấp độ quan sát riêng lẻ. Đừng ngại có nhiều thuộc tính trong bảng tính của bạn;

Mẫu siêu dữ liệu Excel

Hình 2. Bảng tính siêu dữ liệu với hơn 30 thuộc tính

Nếu có thể, hãy bao gồm một trường lấy tên của tệp thực sự chứa dữ liệu đo lường và các tệp khác cung cấp thông tin chi tiết (i. e. giao thức chính xác được sử dụng hoặc tập lệnh phân tích được thực hiện trên các mẫu của bạn, v.v. )

Mẫu siêu dữ liệu Excel

Hình 3. Bảng tính siêu dữ liệu với các trường lấy tên của giao thức được sử dụng và tệp dữ liệu chứa dữ liệu thô

Đặc biệt nếu bạn làm việc với nhiều người trong một dự án, hoặc các thử nghiệm hoặc phép đo tương tự được thực hiện thường xuyên trong nhóm nghiên cứu của bạn, bạn nên phát triển các mẫu siêu dữ liệu cho dữ liệu đã thu thập và có từ vựng được kiểm soát để điền vào các mẫu này. Nếu bạn chuẩn hóa trang siêu dữ liệu của mình, nó có thể được sử dụng lại và có thể dễ dàng so sánh các thử nghiệm khác nhau

Có siêu dữ liệu trong bảng tính Excel không?

Mọi tệp Excel đều có siêu dữ liệu . Theo Wikipedia, “Siêu dữ liệu là dữ liệu [thông tin] cung cấp thông tin về dữ liệu khác”. Điều đó có nghĩa là, siêu dữ liệu là một số dữ liệu không phải là nội dung tệp của bạn mà là thông tin như tên tác giả, dữ liệu được lưu hoặc thậm chí tên tệp.

Siêu dữ liệu trong Excel là gì?

Siêu dữ liệu bao gồm thông tin nhận dạng như tên viết tắt, tên đầy đủ hoặc tên công ty của bạn cũng như thông tin cá nhân khác như tên máy tính và ổ cứng, dữ liệu ẩn trong các ô và nhận xét bạn đã đặt trong bảng tính

Mẫu siêu dữ liệu là gì?

Mẫu siêu dữ liệu mô tả tập hợp các cặp khóa/giá trị có thể được gán cho một tệp hoặc thư mục . Ví dụ: mẫu dữ liệu hóa đơn có thể chứa dữ liệu về hóa đơn, có trường cho ID hóa đơn cũng như ID khách hàng.

Siêu dữ liệu với ví dụ là gì?

Siêu dữ liệu giúp việc tìm kiếm và làm việc với dữ liệu trở nên dễ dàng hơn – cho phép người dùng sắp xếp hoặc định vị các tài liệu cụ thể. Một số ví dụ về siêu dữ liệu cơ bản là tác giả, ngày tạo, ngày sửa đổi và kích thước tệp . Siêu dữ liệu cũng được sử dụng cho dữ liệu phi cấu trúc như hình ảnh, video, trang web, bảng tính, v.v.