Data Integration Specialist là gì

Integration [Data] - Tích hợp [dữ liệu]           Luong Trung Thanh

Luong Trung Thanh

CISA | CISM | ISO 27001 LA | CGEIT | ISO 9001 LA | CDPSE               Published Apr 24, 2018           + Follow

Data Integration - Tích hợp dữ liệu ?

Tích hợp dữ liệu [Data Integration]- ghi rõ ra để tránh hiểu nhầm với việc tích hợp hệ thống như của hạ tầng [infrastructure/network] hoặc một số hệ thống vận hành [Windows/Linux/...] - là công việc đảm bảo hoạt động trao đổi dữ liệu/thông tin giữa các chương trình/hệ thống với nhau để cùng [xử lý] hướng tới mục đích cụ thể nào đó [cái này là ghi theo ý của mình nhé, không phải định nghĩa].

Tích hợp dữ liệu - theo ý kiến cá nhân - có 2 hình thức cơ bản đó là:

  1. Tích hợp để đảm bảo việc trao đổi dữ liệu giữa các hệ thống được thành công [effectiveness], bàn giao hoặc xử lý các công việc tiếp theo theo các luồng công việc định trước.
  2. Tích hợp các dữ liệu từ các nguồn khác nhau để có cái nhìn tổng thể [gọi là Unified] cho người sử dụng/cấp độ quản lý hoặc chuẩn bị cho các Report cụ thể [dạng Report cho BI].

Về cơ bản không có nhiều, nhưng việc tích hợp là cả một vấn đề dài nằm ở phía sau hậu trường cùng với những bí mật chỉ có ... bên triển khai biết

Thách thức trong tích hợp dữ liệu

Vì sao công việc tích hợp dữ liệu lại khó khăn? Các điểm khó khăn cho việc tích hợp này có thể liệt kê ở những điểm [kinh khủng] sau đây:

  1. Sự khác biệt của hệ thống, giữa cái cũ [tradition] và cái mới hơn [tạm gọi là new-trend, new-wave gì đó]. Sự khác biệt này bao gồm các yếu tố: tính mở và sẵn sàng mở của hệ thống. Nói đến cái này là nói đến đại diện của cái tradition của hệ thống ESB [Enterprise Service Bus] và cái mới kiến trúc SOA [Service Oriented Architecture]; hoặc các chương trình phát triển nội bộ [in-house-app] và chương trình quản lý tổng thể ERP/SAP
  2. Sự khác biệt định dạng [chuẩn] của dữ liệu - đại loại là những loại định dạng theo kiểu điện tín như dạng EDI [Electronic Data Interchange], AS32...hoặc các kiểu dữ liệu hiện đại XML, Web Services...
  3. Sự khác biệt về cách thức giao tiếp và trao đổi thông tin - các API [Application Program Interface], Query [Direct/Indirect] và những cách thức khác. Các API thì phải phụ thuộc vào các yếu tổ mở [hãng, nhà sản xuất, nhà cung cấp, các dịch vụ hỗ trợ] cung cấp.
  4. Giới hạn về kết nối, lượng dữ liệu [nhận/gửi] - điều này thì ít chỗ đề cập nhưng nếu không tính toán kỹ có thể nhận đòn mà không rõ lý do.
  5. Hiện giờ cón phải đề cập đến cái môi trường lai [Hybrid] giữa mặt đất [On-premise] và trên mây [On-Cloud]
  6. Một số tình huống không hợp lẽ thường - dạng không hiểu vì sao nó chạy và không biết vì sao nó không chạy ;] và được khuyến nghị giữ y nguyên như lúc nó chạy được [ha..ha..]

Ghi chú: một trong số những yếu tố đau đầu là các tiêu chuẩn buộc phải tuân thủ của doanh nghiệp trong quá trình trao đổi, xử lý thông tin nên việc chuyển dữ liệu phải cần tới yếu tố bảo mật cho các trường thông tin được qui định; tích hợp với việc mã hóa/giải mã/thuật toán là một câu chuyện không đơn giản ;]

Giá trị của Data Integration

Tích hợp dữ liệu là xương sống [back-bone] trong hoạt động của tổ chức doanh nghiệp, tức là dù muốn hay không bản chất là đã có việc tích hợp chỉ khác biệt là ... chạy cơm hay chạy máy thôi [ha..ha..]; và dĩ nhiên nhu cầu phát triển thì càng lúc càng nhiều sẽ đến thời điểm chạy cơm thua xa chạy máy ;]

Giá trị của việc tích hợp là đảm bảo tính "mượt" [smooth] và hiệu quả [efficiency]; và Data Integration là một trong những "cam kết đầu ra" [Outcome] cho mọi dự án. Bên cạnh đó, việc xác định dữ liệu cần thiết là gì và chuyển/trao đổi đúng lượng thông tin cần thiết [không dư thừa/thiếu] sẽ là tiền đề cho mọi phân tích về nghiệp vụ như Business Analyst chẳng hạn.

Ghi chú: Data Integration [DI] luôn là điều kiện tiên quyết cần khảo sát khi thực hiện các dự án về dữ liệu hoặc tối ưu hệ thống [bao gồm cả thông tin & hạ tầng]; các điểm gắn kết [dịch từ Integration] sẽ hiển thị trên các lưu đồ dữ liệu [data flow] cùng với các kiểm soát nếu có/điều kiện thực thi. Ngoài ra, DI đôi khi được sử dụng, xem xét [phần lớn về tính hiệu quả + DQ] để đánh giá mức độ trưởng thành và sự sẵn sàng cho Data Governance.

Trưa 24/04/2018, viết cho vui, cái DI này thực sự khó...chia sẻ kinh nghiệm xương máu thì chỉ khi đụng trận rồi mới thấm các kinh nghiệm chia sẻ của bậc tiền bối & chuyên gia ;] [Nhỏ chưa có gì phải lo, lo là khi nó đủ lớn rồi, hệ thống không còn phù hợp ...].




6  5 Comments                   Like                 Comment                     Share

Le Cong Duc                       Hay nà ...                                Like          Sign in to like this comment                         Reply          Sign in to reply to this comment                                        3y

Khanh Ngo [Matt]                       ví dụ một công ty có một system application  ở dưới đất [OP] và một software application ở trên mây [cloud] thì mình tích hợp dữ liệu sao ta ?                               Like          Sign in to like this comment                         Reply          Sign in to reply to this comment                                        3y

Luong Trung Thanh                       bản chất việc tích hợp là không đơn giản rồi [xem lại phần bài viết] chuyện thành công hay thất bại nói thật là không biết và cũng không dám khẳng định case nào thành công, case nào không, chủ yéu là mức độ chấp nhận việc tích hợp ở mức nào.                               Like          Sign in to like this comment                         Reply          Sign in to reply to this comment                                        3y

Khanh Ngo [Matt]                       Luong Trung Thanh hehe ko đơn giản vậy đâu...hybrid là banh xác đó. Ở VN chưa case nào thành công :]                               Like          Sign in to like this comment                         Reply          Sign in to reply to this comment                      1 Like                                   3y        See more comments

Sign In to leave your comment

To view or add a comment, sign in       To view or add a comment, sign in

More articles by this author           See all

Chuyện hợp tan - Cá nhân - Nhóm

Jul 29, 2019

MVP - Minimum Viable Product

Oct 19, 2018

Data Masking - Che dấu dữ liệu

Jul 29, 2018

Chủ Đề