Bài tập lớn xử lý ảnh đại học bách khoa

Nhóm tài liệu Download Yêu cầu gỡ tài liệu

giải thuật nén huffman.pdf

xla_c1_co ban_08082018.pdf

xla_c2_trinh bay _ danh gia_08082018.pdf

xla_c3_histogram_08082018.pdf

xla_c4_xu ly mien khong gian_08082018 - copy.pdf

xla_c5_xu ly mien bien doi_08082018.pdf

xla_c6_xu ly hinh thai hoc_08082018.pdf

xla_c7_cac chuyen de xu ly anh_08082018 - copy.pdf

xla_c0_gioi thieu_08082018_k.pdf

danhsachbtl_updated.pdf

đề bài tập lớn môn xử lý ảnh.pdf

141_405017_a01_xlanhvaxltiennoi.pdf

142_405017_a01_xulyanhvaxulytiengnoi.pdf

151_405017_xulyanhvaxulytiengnoi.pdf

171_ee3035_xulyanh.pdf

171_ee3035_xulyanh_1.pdf

172_ee3035_xulyanh.pdf

181_ee3035_a01_xulyanh.pdf

dapanxulyanh.pdf

solution_final_i.pdf

thihocky-xulyanh-2020-01-05.pdf

Bài tập xử lý ảnh 1
Tất cả các câu hỏi sau đây đều được thực hiện trên Matlab.
1 Đọc một ảnh và hiển thị ảnh đó. Nếu là ảnh màu thì chuyển sang ảnh mức xám.
2 Tìm hiểu lệnh imshow, minh họa cho các trường hợp khác nhau.
3 Cho một ảnh mức xám I, kích thước MxN. Viết chương trình để thực hiện việc lấy mẫu xuống
với hệ số là 2 [theo cả phương ngang và phương thẳng đứng] đối với ảnh I.
Cùng câu hỏi trên với hệ số lấy mẫu xuống là 4.
4 Cho ảnh mức xám I, giả sử có 256 mức xám. Lượng tử hóa đều ảnh I sử dụng 64 mức xám.
Cùng câu hỏi trên nhưng sử dụng 4 mức lượng tử.
5 Cho ảnh mức xám I. Tìm giá trị lớn nhất, bé nhất của I. Tìm giá trị trung bình và median của I.
Tìm variance và độ lệch chuẩn của I.
6 Giả sử ảnh mức xám I được chia thành 16 khối đều nhau như sau [ví dụ chọn I có kích thước là
256 x 256 pixel]
I1

I2

I3

I4

I5

I6

I7

I8

I9

Từ ảnh I, tạo ảnh Y có cấu trúc như sau. Hiển thị ảnh Y.
I16

Thông tin tài liệu

Ngày đăng: 08/05/2017, 19:07

Bài tập xử ảnh Tất câu hỏi sau thực Matlab Đọc ảnh hiển thị ảnh Nếu ảnh màu chuyển sang ảnh mức xám Tìm hiểu lệnh imshow, minh họa cho trường hợp khác Cho ảnh mức xám I, kích thước MxN Viết chương trình để thực việc lấy mẫu xuống với hệ số [theo phương ngang phương thẳng đứng] ảnh I Cùng câu hỏi với hệ số lấy mẫu xuống 4 Cho ảnh mức xám I, giả sử có 256 mức xám Lượng tử hóa ảnh I sử dụng 64 mức xám Cùng câu hỏi sử dụng mức lượng tử Cho ảnh mức xám I Tìm giá trị lớn nhất, bé I Tìm giá trị trung bình median I Tìm variance độ lệch chuẩn I Giả sử ảnh mức xám I chia thành 16 khối sau [ví dụ chọn I có kích thước 256 x 256 pixel] I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11 I12 I13 I14 I15 I16 Từ ảnh I, tạo ảnh Y có cấu trúc sau Hiển thị ảnh Y I16 I15 I14 I13 I12 I11 I10 I9 I8 I7 I6 I5 I4 I3 I2 I1

- Xem thêm -

Xem thêm: Bài Tập Xử Lý Ảnh Đại Học Bách Khoa, Bài Tập Xử Lý Ảnh Đại Học Bách Khoa,

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN ĐIỆN

====o0o====

BÁO CÁO ĐỀ TÀI

NHẬP MÔN NGÀNH ĐIỆN

ĐỀ TÀI :

XỬ LÝ ẢNH

Giảng viên hướng dẫn: TS. Phạm Văn Trường

Nhóm sinh viên thực hiện:

Họ tên MSSV

  1. Tạ Đức Hiển 20179900
  2. Nguyễn Văn Thìn 20192091
    1. Ngô Việt Anh 20200022
    2. Nguyễn Thế Anh 20200033
    3. Vũ Việt Anh 20200052
    4. Hồ Trọng Ánh 20200056
    5. Lê Thế Ân 20200058

Hà Nội, 03/

Sơ đồ này bao gồm các thành phần sau:

a] Phần thu nhận ảnh [Image Acquisition]

Đây là công đoạn đầu tiên mang tính quyết định đối với quá trình XLA. Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera, sensor, máy scanner,v... và sau đó các tín hiệu này sẽ đ ợc số hóa. Việc lựa chọn các thiếtƣ bị thu nhận ảnh sẽ phụ thuộc vào đặc tính của các đối t ợng cần xử lý. Các ƣ thông số quan trọng ở bước này là độ phân giải, chất lựợng màu, dung lựợng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.

Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera là ảnh tương tự [loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng], cũng có loại camera đã số hoá [như loại CCD – Change Coupled Device] là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh. Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường [ánh sáng, phong cảnh]

b] Tiền xử lý [Image Processing]

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn. Ở bước này, ảnh sẽ được cải thiện về độ t ơng phản, khử nhiễu, khử bóng, khử độ lệch,v... với mục đích ƣ làm cho chất lượng ảnh trở lên tốt hơn nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình XLA. Quá trình này thường được thực hiện bởi các bộ lọc.

c] Phân đoạn [Segmentation] hay phân vùng ảnh

Phân đoạn ảnh là bước then chốt trong XLA. Giai đoạn này phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng màu, cùng mức xám v... Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về

nhiều phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc tr ng ƣ nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ [hoặc mã vạch] trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số [hoặc các vạch] riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.

d] Biểu diễn ảnh [Image Representation]

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh [ảnh đã phân đoạn] cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng [Feature Selection] gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác.

e] Nhận dạng và nội suy ảnh [Image Recognition and

Interpretation]

Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học [hoặc lưu] từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: - Nhận dạng theo tham số. - Nhận dạng theo cấu trúc. Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự [chữ in, chữ viết tay, chữ ký điện tử], nhận dạng văn bản [Text], nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người...

f] Cơ sở tri thức [Knowledge Base]

Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.

1 NHỮNG VẤN ĐỀ CƠ BẢN TRONG HỆ THỐNG XỬ LÝ

ẢNH

1.2 Điểm ảnh [Picture Element]

Gốc của ảnh [ảnh tự nhiên] là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính [số], ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí [không gian] và độ sáng [mức xám]. Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh [PEL: Picture Element] hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ [x, y].

Định nghĩa: Điểm ảnh [Pixel] là một phần tử của ảnh số tại toạ độ [x, y] với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám [hoặc màu] của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.

1.2 Độ phân giải của ảnh [Resolution]

Định nghĩa: Độ phân giải của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều.

1.2 Mức xám của ảnh

Một điểm ảnh [pixel] có hai đặc trưng cơ bản là vị trí [x, y] của điểm ảnh và độ xám của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng trong xử lý ảnh.

a] Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại điểm đó.

b] Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 [Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte [8 bit] để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28 =256 mức, tức là từ 0 đến 255].

c] Ảnh đen trắng: là ảnh có hai màu đen, trắng [không chứa màu khác] với mức xám ở các điểm ảnh có thể khác nhau.

d] Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.

e] Ảnh màu: trong khuôn khổ lý thuyết ba màu [Red, Blue, Green] để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈ 16,7 triệu màu.

1.2 Định nghĩa ảnh số

Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật.

1.2 Các thành phần cơ bản của hệ thống xử lý ảnh

Hình 1 Các thành phần chính của hệ thống xử lý ảnh. Hệ thống gồm các đầu đo [thu nhận ảnh]; bộ số hóa ; máy tính số; Bộ hiển thị; Bộ nhớ. Một hệ thống xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ mạch chuyển đổi đồ hoạ VGA hoặc SVGA, đĩa chứa các ảnh dùng để kiểm tra các thuật toán và một màn hình có hỗ trợ VGA hoặc SVGA.

Ảnh mức xám được áp dụng trong nhiều lĩnh vực như sinh vật học hoặc trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng ứng dụng được trên ảnh màu. Với lý do đó, hệ thống ban đầu nên chỉ bao gồm cấc thiết bị thu nhận và hiển thị ảnh đen trắng. Với ảnh màu, nên sử dụng một hệ thống mới như Hình 1, trừ trường hợp bạn cần một camera TV màu và một màn hình đa tần số [ví dụ như NEC MultiSync, Sony Multiscan, hoặc Mitsubishi Diamond Scan] để hiển thị ảnh màu. Nếu khả năng hạn chế, có thể dùng PC kèm theo vỉ mạch VGA và màn hình VGA, để dựng ảnh được.

1 NHỮNG VẤN ĐỀ KHÁC TRONG XỬ LÝ ẢNH

1.3 Biến đổi ảnh [Image Transform]

Trong xử lý ảnh do số điểm ảnh lớn các tính toán nhiều [độ phức tạp tính toán cao] đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu. Các phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi. Người ta sử dụng các phép toán tương đương hoặc biến đổi sang miền xử lý khác để dễ tính toán.

CHƯƠNG II :NHỮNG QUY TRÌNH VỀ XỬ LÝ ẢNH VÀ

CƠ SỞ KHOA HỌC

2. Ảnh và biểu diễn ảnh

Ảnh trong thực tế là một ảnh liên tục cả về không gian và giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính thì cần thiết phải tiến hành số hóa ảnh. Quá trình số hóa biến đổi các tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu [rời rạc hóa về không gian] và lượng tử hóa các thành phần giá trị mà về nguyên tắc bằng mắt th ờng không thể phân biệt đ ợc hai điểm liền kề nhau.ƣ ƣ Các điểm như vậy được gọi là các pixel [Picture Element] hay các phần tử ảnh hoặc điểm ảnh. Ở đây cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ họa máy tính. Để tránh nhầm lẫn ta gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể xém xét như sau: khi ta quan sát màn hình [trong chế độ đồ họa], màn hình không liên tục mà gồm các điểm nhỏ, gọi là pixel. Mỗi pixel gồm một tập tọa độ [x, y] và màu.

Như vậy mỗi ảnh là tập hợp các điểm ảnh. Khi được số hóa nó thường được biểu diễn bởi mảng 2 chiều I[n,p]: n là dòng và p là cột.

Về mặt toán học có thể xem ảnh là một hàm hai biến f[x,y] với x, y là các biến tọa độ. Giá trị số ở điểm [x,y] tương ứng với giá trị xám hoặc độ sáng của ảnh [x là các cột còn y là các hàng]. Giá trị của hàm ảnh f[x,y] được hạn chế trong phạm vi của các số nguyên dương.

0 ≤ f[x,y] ≤ fmax

Với ảnh đen trắng mức xám của ảnh có thể được biểu diễn bởi một số như sau:

f =k ∫

λ = 0

∞ c [ λ ] SBW [ λ ] dλ

Trong đó SBW [λ] là đặc tính phổ của cảm biến được sử dụng và k là hệ số tỷ lệ xích. Vì sự cảm nhận độ sáng có tầm quan trọng hàng đầu đối với ảnh đen trắng nên SBW [λ] đ ợc chọn giống như là hiệu suất sáng tương đối. Vì f biểu diễn ƣ công suất trên đơn vị diện tích, nên nó bao giờ cũng không âm và hữu hạn.

0≤ f ≤ fmax

Trong đó fmax là giá trị lớn nhất mà f đạt được. Trong xử lý ảnh, f được chia thang sao cho nó nằm trong một phạm vi thuận lợi nào đó.

Thông thường đối với ảnh xám, giá trị fmax là 255 [ 28 =256] bởi vì mỗi phần tử ảnh được mã hóa bởi một byte. Khi quan tâm đến ảnh màu ta có thể mô tả màu

qua ba hàm số: thành phần màu đỏ qua R[x,y], thành phần màu lục qua G[x,y] và thành phần màu lam qua B[x,y]. Bộ ba giá trị R, G, và B nhận được từ:

R =k ∫

λ = 0

∞ c [ λ ] SR [ λ ] dλ

G =k ∫

λ = 0

∞ c [ λ ] SG [ λ ] dλ

B =k ∫

λ = 0

∞ c [ λ ] SB [ λ ] dλ

Ở đó SR [λ], SG [λ], SB [λ] theo thứ tự là những đặc tính phổ của các cảm biến [bộ lọc] đỏ, lục và lam. R, G, B cũng không âm và hữu hạn.

Ảnh có thể được biểu diễn theo một trong hai mô hình: mô hình Vector hoặc mô hình Raster.

Mô hình Vector: Ngoài mục đích tiết kiệm không gian lưu trữ, dễ dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm.. những yêu cầu này thì kỹ thuật biểu diễn vector tỏ ra ưu việt hơn. Trong mô hình này, người ta sử dụng hướng vector của các điểm ảnh lân cận để mã hóa và tái tạo lại hình ảnh ban đầu. Các ảnh vector được thu nhận trực tiếp từ các thiết bị số hóa như Digitalize hoặc được chuyển đổi từ các ảnh Raster thông qua các chương trình vector hóa.

Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay. Ảnh đ ợc ƣ biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn. Các ảnh được sử dụng trong phạm vi của đề tài này cũng là các ảnh được biểu diễn theo mô hình Raster.

Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên một lưới [raster] hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với nhau.

số các bytes được nén đ ợc tính bởi 7 bit thấp còn lại. Nếu bit cao tắt [giá tri 0]ƣ thì đay là gói nén các bytes toàn bit 1. Số các bytes được nén được tính bởi 7 bit thấp còn lại.

Các kiểu file IMG phong phú như vậy là do ảnh IMG là ảnh đen trắng nên chỉ cần 1 bit cho một pixel thay vì 4 hoặc 8 bit như đã nói ở trên toàn bộ ảnh chỉ có điểm sáng hoặc tối tương ứng với 1 hoặc 0. Tỷ lệ nén của file này là khá cao.

2.2. File ảnh PCX

Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất. Nó sử dụng phương pháp mã loạt dài RLE [Run-Length-Encoded] để nén dữ liệu ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế, phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX gồm 3 phần: đầu tệp [header], dữ liệu ảnh [image data] và bảng màu mở rộng.

Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố như sau:

  • 1 byte : chỉ ra kiểu định dạng. Nếu là kiểu PCX/PCC nó luôn có giá trị là 0Ah.

  • 1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:

  • 0: version 2.

  • 2: version 2 với bảng màu.

  • 3: version 2 hay 3 không có bảng màu.

  • 5: version 3 có bảng màu.

  • 1 byte: chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo phương pháp BYTE PACKED, nếu không là phương pháp RLE.

  • 1 byte: số bit cho một điểm ảnh plane.

  • 1 word: toạ độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là [0,0]; còn PCC thì khác [0,0].

  • 1 word: toạ độ góc phải dưới.

  • 1 word: kích thước bề rộng và bề cao ảnh.

  • 1 word: số điểm ảnh.

  • 1 word: độ phân giải màn hình.

  • 48 byte: chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.

  • 1 byte: không dùng đến và luôn đặt là 0.

+1 byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, với ảnh 256 màu [1 pixel/8 bit] thì số bit plane lại là 1.

  • 1 byte: số bytes cho một dòng quét ảnh.

  • 1 word: kiểu bảng màu.

  • 58 byte: không dung.

Tóm lại, định dạng ảnh PCX thường đ ợc dùng để l u trữ ảnh vì thao táƣ ƣ c đơn giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định, nên trong một số trường hợp nó làm tăng kích th ớc lưu trữ. Và cƣ ũng vì nhược điểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khác mềm dẻo hơn: định dạng TIFF [Targed Image File Format] sẽ mô tả dưới đây:

Hình 2.2. Cấu trúc tệp ảnh dạng PCX.

2.2.2 Kỹ thuật nén ảnh PCX

a] Kiểu nén: Thông tin về giá trị điểm xám cho mỗi điểm ảnh PCX được lưu trữ theo kiểu nén, khi được lưu trữ theo kiễu nén các file phải tuân theo quy luật nhất định: là một ma trận hai chiều để lưu trữ thông tin liên quan về các giá trị mức xám. Kỹ thuật dùng để nén ảnh PCX là kỹ thuật Run Length Encode [RLE], phần tử thông tin cần nén là 1 bytes.

b] Tỷ số nén: Trong kỹ thuật nén ảnh ng ời ta quan tâm nhiều đến tỷ số nén. Tỷƣ số nén của ảnh được tính bởi tỷ số giữa kích thước lưu trữ ảnh sau khi nén trên kích thước cần thiết để l u trữ ảnh không nén. Giá trị của tỷ sốƣ này phụ thuộc vào mỗi file ảnh, ảnh pcx có thể là 1,4 hoặc 8 bits, nếu xét yếu tố này ảnh hưởng đến tỷ số nén ta thấy:

Hình 2.2.2 Sơ đồ giải thuật nén một dòng ảnh cho file PCX

2.2.2 Giải nén ảnh PCX.

Quá trình nén được tiến hành theo từng dòng như sau:

  • Thứ tự đầu tiên trong file ảnh PCX là dòng đầu tiên của ảnh.

  • Việc nén file ảnh PCX phải bắt đầu từ dòng đầu tiên của ảnh.

  • Kết thúc khi tất cả các dòng đều được nén.

  • Mỗi một dòng nén phải tuân theo cùng một giải thuật nén của file PCX.

2.2. Định dạng ảnh TIFF

Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan đến việc mở rộng tệp ảnh cố định. Về cấu trúc, nó cũng gồm 3 phần chính:

  • Phần Header [IFH]: có trong tất cả các tệp TIFF và gồm 8 byte:
  • 1 word: chỉ ra kiểu tạo tệp trên máy tính PC hay Macintosh. Hai loại này khác nhau rất lớn ở thứ tự các byte l u trữ trong các số dài ƣ 2 hay 4 byte. Nếu trường này có giá trị là 4D4Dh thì đó là ảnh cho máy Macintosh; nếu là 4949h là của máy PC.

  • 1 word: version. Từ này luôn có giá trị là 42. Có thể coi đó là đặc trưng của file TIFF vì nó không thay đổi.

  • 2 word: giá trị Offset theo byte tính từ đầu file tới cấu trúc IFD[Image File Directory] là cấu trúc thứ hai của file. Thứ tự các byte ở đây phụ thuộc vào dấu hiệu trường đầu tiên.

  • Phần thứ 2 [IFD]: Nó không ở ngay sau cấu trúc IFH mà vị trí của nó được xác định bởi trường Offset trong đầu tệp. Có thể có một hay nhiều IFD cùng tồn tại trong file [nếu file có nhiều hơn 1 ảnh].

Một IFD gồm:

  • 2 byte: chứa các DE [Directory Entry].

  • 12 byte là các DE xếp liên tiếp. Mỗi DE chiếm 12 byte.

  • 4 byte : chứa Offset trỏ tới IFD tiếp theo. Nếu đây là IFD cuối cùng thì tr ờng này có giá trị là 0. - Cấu trúc phần dữ liệu thứ 3: các DE.ƣ

Các DE có độ dài cố định gồm 12 byte và chia làm 4 phần:

  • 2 byte: Chỉ ra dấu hiệu mà tệp ảnh đã được xây dựng.

  • 2 byte: kiểu dữ liệu của tham số ảnh. Có 5 kiểu tham số cơ bản:

a] 1: BYTE [1 byte]. b] 2: ASCII [1 byte]. c] 3: SHORT [2 byte]. d] 4: LONG [4 byte]. e] 5: RATIONAL [8 byte]

  • 4 byte: trường độ dài [bộ đếm] chứa số lượng chỉ mục của kiểu dữ liệu đã chỉ ra. Nó không phải là tổng số byte cần thiết để lưu trữ. Để có số liệu này ta cần nhân số chỉ mục với kiểu dữ liệu đã dùng.

  • 4 byte: đó là Offset tới điểm bắt đầu dữ liệu thực liên quan tới dấu hiệu, tức là dữ liệu liên quan với DE không phải lưu trữ vật lý cùng với nó nằm ở một vị trí nào đó trong file.

Dữ liệu chứa trong tệp thường đ ợc tổ chức thành các nhómƣ dòng [cột] quét của dữ liệu ảnh. Cách tổ chức này làm giảm bộ nhớ cần thiết cho việc đọc

Nếu Min = 0, Max = 1 kỹ thuật chuyển ảnh thành ảnh đen trắng được ứng dụng khi quét và nhận dạng văn bản có thể xảy ra sai sót nền thành ảnh hoặc ảnh thành nền dẫn đến ảnh bị đứt nét hoặc dính.

b] Bó cụm Kỹ thuật nhằm giảm bớt số mức xám của ảnh bằng cách nhóm lại số mức xám gần nhau thành 1 nhóm

Nếu chỉ có 2 nhóm thì chính là kỹ thuật tách ngưỡng. Thông thường có nhiều nhóm với kích thước khác nhau.

Để tổng quát khi biến đổi người ta sẽ lấy cùng 1 kích thước bunch_size

I [i,j] =[ I [i,j]/ bunch _size ]* bunch_size "[i,j] Ví dụ: Bó cụm ảnh sau với bunch_size= 3

1 2 4 6 7 2 1 3 4 5 I = 7 2 6 9 1 4 1 2 1 2

0 0 3 6 60 0 3 3 3

Ikq = 6 0 6 9 0 3 0 0 0 0

Ảnh I được gọi là cân bằng "lý tưởng" nếu với mọi mức xám g, g’ ta có h[g] = h[g’]

Giả sử, ta có ảnh I ~ kích thước m ́ n, new_level ~ số mức xám của ảnh cân bằng

Ví dụ: Cân bằng ảnh sau với new_level= 4

Ma trận ảnh

Lần lượt tính h[g], t[g] và f[g].

Chủ Đề