Bài toán tìm kiếm ảnh theo phân lớp năm 2024

  • 1. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM --- LÊ CÔNG KHANH TÌM KIẾM ẢNH TRONG TẬP DỮ LIỆU ẢNH LỚN DỰA TRÊN ĐẶC TRƯNG LUẬN VĂN THẠC SĨ Chuyên ngành : CÔNG NGHỆ THÔNG TIN Mã số ngành: 60480201 TP. HỒ CHÍ MINH, tháng 11 năm 2016
  • 2. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM --- LÊ CÔNG KHANH TÌM KIẾM ẢNH TRONG TẬP DỮ LIỆU ẢNH LỚN DỰA TRÊN ĐẶC TRƯNG LUẬN VĂN THẠC SĨ Chuyên ngành : CÔNG NGHỆ THÔNG TIN Mã số ngành: 60480201 CÁN BỘ HƯỚNG DẪN KHOA HỌC: TS. NGUYỄN THANH BÌNH TP. HỒ CHÍ MINH, tháng 11 năm 2016
  • 3. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM Cán bộ hướng dẫn khoa học: TS. NGUYỄN THANH BÌNH (Ghi rõ họ, tên, học hàm, học vị và chữ ký) Luận văn Thạc sĩ được bảo vệ tại Trường Đại học Công nghệ TP. HCM vào ngày 17 tháng 12 năm 2016. Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ Luận văn Thạc sĩ) TT Họ và tên Chức danh Hội đồng 1 Chủ Tịch 2 Phản biện 1 3 Phản biện 2 4 Ủy viên 5 Ủy viên, Thư ký Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn sau khi Luận văn đã được sửa chữa (nếu có). Chủ tịch Hội đồng đánh giá Luận văn
  • 4. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 TRƯỜNG ĐH CÔNG NGHỆ TP. HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM PHÒNG QLKH – ĐTSĐH Độc lập – Tự do – Hạnh phúc TP. HCM, ngày..… tháng….. năm 2016 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Công Khanh................................................Giới tính: Nam ................ Ngày, tháng, năm sinh: 17-6-1977..............................................Nơi sinh: Tiền Giang ...... Chuyên ngành: Công Nghệ Thông Tin ......................................MSHV: 1441860050 ..... I- Tên đề tài: Tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng. II- Nhiệm vụ và nội dung: - Nghiên cứu kỹ thuật tìm kiếm ảnh theo nội dung, từ đó, đề xuất mô hình tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng ảnh. - Xây dựng hệ thống tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng ảnh. III- Ngày giao nhiệm vụ: 23/01/2016 IV- Ngày hoàn thành nhiệm vụ: ........................................................................................... V- Cán bộ hướng dẫn: Tiến Sỹ Nguyễn Thanh Bình CÁN BỘ HƯỚNG DẪN KHOA QUẢN LÝ CHUYÊN NGÀNH (Họ tên và chữ ký) (Họ tên và chữ ký)
  • 5. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã được cảm ơn và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. Học viên thực hiện Luận văn Lê Công Khanh
  • 6. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 ii LỜI CÁM ƠN Trước hết em xin bày tỏ lòng biết ơn sâu sắc nhất tới thầy giáo hướng dẫn TS. Nguyễn Thanh Bình đã tận tình giúp đỡ em rất nhiều trong suốt quá trình tìm hiểu nghiên cứu và hoàn thành báo cáo luận văn. Em xin chân thành cảm ơn các thầy cô đã trang bị cho em những kiến thức cơ bản cần thiết để em có thể hoàn thành luận văn này. Xin gửi lời cảm ơn đến bạn bè những người luôn bên em đã động viên và tạo điều kiện thuận lợi cho em, tận tình giúp đỡ chỉ bảo em những gì em còn thiếu sót trong quá trình làm báo cáo luận văn. Cuối cùng em xin bày tỏ lòng biết ơn sâu sắc tới những người thân trong gia đình đã giành cho em sự quan tâm đặc biệt và luôn động viên em. Vì thời gian có hạn, trình độ hiểu biết của bản thân còn nhiều hạn chế. Vì vậy, trong đồ án không tránh khỏi những thiếu sót, em rất mong nhận được sự đóng góp ý kiến của tất cả các thầy cô giáo cũng như các bạn bè để luận văn của em được hoàn thiện hơn. Em xin chân thành cảm ơn! Tác giả luận văn Lê Công Khanh
  • 7. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 iii TÓM TẮT Sự tăng không ngừng về lượng ảnh trên Web tạo nguồn ảnh phong phú đáp ứng được nguồn cung ảnh cho nhu cầu của con người. Mặc dù một số mô hình tìm kiếm ảnh đã ra đời đáp ứng phần nào nhu cầu tìm kiếm ảnh, song nâng cao chất lượng tìm kiếm luôn là vấn đề được đặt ra. Bài toán tìm kiếm ảnh, và nâng cao chất lượng xếp hạng ảnh đã và đang nhận được sự quan tâm đặc biệt. Đề tài của luận văn: “Tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng“ nhằm để giải quyết bài toán trên. Nhiệm vụ của luận văn là nghiên cứu các kỹ thuật tìm kiếm ảnh theo nội dung và đề xuất mô hình tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng ảnh. Đầu tiên, luận văn nêu một số đặc trưng cơ bản của ảnh cũng như một số nghiên cứu liên quan về các đặc trưng ảnh. Tiếp theo, luận văn đề xuất phương pháp tìm kiếm ảnh theo nội dung, đưa ra mô hình phối hợp các đặc trưng kết hợp với toán tử LTP và xây dựng giải thuật truy vấn. Luận văn đã được hiện thực quá trình truy vấn ảnh bằng giải thuật đã đề xuất. Quá trình thực nghiệm được thực hiện trên nhiều tập dataset khác nhau, chứa các đối tượng khác nhau như người, xe, hoa, cảnh… trong tập dữ liệu của Wang tại địa chỉ http://wang.ist.psu.edu/docs/related/. Tập dữ liệu này bao gồm 10.000 ảnh và thử nghiệm trên 2 phương pháp: Truy xuất bằng query và truy xuất dựa trên phương pháp support vector machine (SVM). Qua kết quả thực nghiệm, chúng ta thấy rằng phương pháp đề xuất cho kết quả tốt hơn phương pháp SVM. Phương pháp đề xuất đã kết hợp các đặc trưng cục bộ và toàn cục lại với nhau. Đây là lý do giải thích tại sao phương pháp đề xuất tốt hơn phương pháp SVM.
  • 8. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 iv ABSTRACT The continuous increase in volume images on the web to create images rich source supply to meet the demand picture for the people. Although some models were launched image search partly meet the need to look for images, but improve the quality of search is always a problem arises. Image search problem and improve image quality ratings have been received special attention. The theme of the thesis: "Content-based image retrieval in the large image database based on the characteristic" in order to solve the problem on. The task of the thesis is to study the technical content image search and search suggestions model images in large image data sets based on image features. Firstly, the thesis outlined some basic characteristics of the image as well as a number of studies related to the image features. Secondly, the thesis proposed the method for image searching by contents, making coordination model characteristics associated with LTP and building operators query algorithms. Thesis has been realized by the image retrieval algorithm was proposed. The processing of this work do on many different training dataset, containing various objects such as people, cars, flowers, landscape ... in the data set of Wang at http://wang.ist.psu.edu/docs/related/. This dataset includes 10,000 images. We test on two methods: Retrieve query and retrieval using methods based on support vector machine (SVM). Through experimental results, we found that the proposed method gives better results than SVM method. The method propose combining local characteristics and wikis together. This is the reason why the proposed method better methods based on SVM method.
  • 9. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 v MỤC LỤC LỜI CAM ĐOAN ....................................................................................................... i LỜI CÁM ƠN .............................................................................................................. ii TÓM TẮT .................................................................................................................. iii ABSTRACT ............................................................................................................... iv MỤC LỤC ................................................................................................................... v DANH MỤC TỪ VIẾT TẮT .................................................................................... vii DANH MỤC CÁC BẢNG ...................................................................................... viii DANH MỤC CÁC BIỂU ĐỒ, ĐỒ THỊ, SƠ ĐỒ, HÌNH ẢNH ................................. ix CHƯƠNG 1: GIỚI THIỆU ......................................................................................... 1 1.1 Giới thiệu đề tài .............................................................................................. 1 1.2Mục tiêu của đề tài ............................................................................................ 2 1.3 Nội dung đề tài .................................................................................................. 2 1.4 Giới hạn của đề tài ............................................................................................ 2 1.5 Phương pháp nghiên cứu .................................................................................. 2 1.6 Cấu trúc luận văn .............................................................................................. 3 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN .......... 4 2.1Cơ sở lý thuyết .................................................................................................. 4 2.1.1Đặc trưng màu sắc ..................................................................................... 4 2.1.2 Đặc trưng kết cấu ..................................................................................... 10 2.1.3 Đặc trưng hình dạng ................................................................................ 16 2.1.4 Mô tả Boundary ....................................................................................... 16 2.1.5 Mô tả theo Vùng (Region) ....................................................................... 17 2.2 Độ đo tương đồng ........................................................................................... 19 2.2.1Độ đo về màu sắc .................................................................................... 19 2.2.2 Độ đo về kết cấu ...................................................................................... 20 2.2.3 Độ đo về hình dạng .................................................................................. 21 2.3 Các nghiên cứu liên quan ................................................................................ 24 2.3.1 Trong nước .............................................................................................. 24 2.3.2 Ngoài nước .............................................................................................. 24
  • 10. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 vi CHƯƠNG 3: PHƯƠNG PHÁP ĐỀ XUẤT TÌM KIẾM ẢNH THEO NỘI DUNG.26 3.1 Yêu cầu bài toán ............................................................................................. 26 3.2. Mô hình nghiên cứu ....................................................................................... 28 3.2.1. Mô hình phối hợp các đặc trưng ảnh ...................................................... 28 3.2.2 Kết hợp toán tử LTP (Local Ternary Pattern) ......................................... 29 3.3 Phương pháp rút trích đặc trưng ảnh và truy vấn ảnh..................................... 32 3.3.1 Phối hợp các đặc trưng để truy vấn ảnh .................................................. 32 3.3.1.1 Xử lý cơ sở dữ liệu ........................................................................... 32 3.3.1.2 Xử lý ảnh truy vấn ............................................................................ 32 3.3.1.3 Đo sự tương tự giữa các véc tơ ảnh ................................................. 32 3.3.1.4 Hiển thị kết quả trả về ...................................................................... 33 3.3.2 Truy vấn ảnh dùng moments của LTP .................................................... 33 3.3.2.1 Moments ........................................................................................... 33 3.3.2.2 Mẫu tam phân (LTP) và Moment..................................................... 34 3.3.2.3 Phương pháp đề xuất ........................................................................ 35 CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM ......................................................... 37 4.1 Tập dữ liệu thử nghiệm ................................................................................... 38 4.2 Kết quả truy vấn .............................................................................................. 39 4.3 Code đặc trưng ................................................................................................ 45 CHƯƠNG 5: KẾT LUẬN .................................................................................... 48 5.1 Kết quả đạt được ............................................................................................. 48 5.2 Ưu điểm và nhược điểm của giải thuật đề xuất .............................................. 48 5.2.1 Ưu điểm của giải thuật đề xuất ................................................................ 48 5.2.2 Nhược điểm của giải thuật đề xuất .......................................................... 48 5.3 Đóng góp của luận văn ................................................................................... 48 5.3.1 Đóng góp khoa học .................................................................................. 49 5.3.2 Đóng góp thực tiễn .................................................................................. 49 5.4 Hướng mở rộng ............................................................................................... 49 TÀI LIỆU THAM KHẢO ......................................................................................... 50
  • 11. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 vii DANH MỤC TỪ VIẾT TẮT CBIR LBP LTP RGB CMY HSI HOG SVM MSVM : Content Based Image Retrieval : Local Binary Pattern : Local Ternary Pattern : Red - Green – Blue : Cyan-Magenta-Yellow : Hue-Saturation-Intensity : Histogram of oriented gradients : Support Vector machine : Multiple Support Vector Machines
  • 12. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 viii DANH MỤC CÁC BẢNG Bảng 4.1 Kết quả truy xuất ảnh của phương pháp đề xuất so với phương pháp khác.. 42
  • 13. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 ix DANH MỤC CÁC BIỂU ĐỒ, ĐỒ THỊ, SƠ ĐỒ, HÌNH ẢNH Hình 2.1: Mô hình phân lớp của CBIR ...................................................................... 4 Hình 3.1: Cấu trúc của hệ thống CBIR .....................................................................26 Hình 3.2 Sơ đồ truy xuất hình hảnh từ cơ sở dữ liệu ảnh .........................................35 Hình 4.1 Một số hình trong tập dataset Wang ..........................................................39 Hình 4.2 Giao diện chính chương trình.....................................................................39 Hình 4.3 Giao diện chọn dataset ...............................................................................40 Hình 4.4 Giao diện chọn thư mục chứa ảnh..............................................................40 Hình 4.5 Giai diện rút trích đặc trưng của ảnh..........................................................40 Hình 4.6 Giao diện chọn ảnh ban đầu......................................................................41 Hình 4.7 Kết quả truy xuất........................................................................................42
  • 14. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 1 CHƯƠNG 1: GIỚI THIỆU 1.1 Giới thiệu đề tài Cùng với sự phát triển của công nghệ thông tin và Internet đã làm gia tăng nhanh chống dữ liệu đa phương tiện, khiến cho nhu cầu chia sẽ và tìm kiếm những loại tài nguyên này cũng tăng theo, trong đó có tài nguyên là dữ liệu kiểu hình ảnh. Tìm kiếm dữ liệu hình ảnh được sử dụng với nhiều mục đích khác nhau và được ứng dụng nhiều trong các lĩnh vực quan trọng của cuộc sống như trong hệ thống bảo mật, an ninh, y tế hay các hệ thống phát hiện chuyển động... Vì thế việc nghiên cứu và phát triển các hệ thống tìm kiếm ảnh ngày càng trở nên cấp thiết. Có hai kiểu tìm kiếm đó là tìm kiếm theo từ khóa và tìm kiếm theo nội dung ảnh (CBIR-Content Based Image Retrieval), tìm kiếm theo từ khóa dễ thỏa mãn được nhu cầu người dùng với các nhu cầu tìm kiếm ảnh mới theo như mong muốn xuất hiện trong suy nghĩ của họ, tìm tiếm theo từ khóa thì nhanh hơn so với tìm kiếm theo nội dung bởi vì nó hoạt động dựa trên việc phân tích và so sánh các từ hoặc cụm từ tương ứng với nhau để đưa ra kết quả và không đòi hỏi người dùng phải có ảnh mẫu. Nhược điểm của phương pháp này là kết quả không chính xác. Một phương pháp khác để tìm kiếm hình ảnh là tìm kiếm ảnh theo nội dung của hình ảnh. Phương pháp này cần một ảnh mẫu cho đầu vào để tìm ra những bức ảnh tương ứng. Phương pháp này cho kết quả tốt hơn về tính đúng đắn bởi vì thông qua nội dung của bức ảnh sẽ được biểu diễn các đặc trưng trong bức ảnh và đưa ra những kết quả tương ứng với nội dung bức ảnh đầu vào. Nó đáp ứng tốt hơn cho người dùng, tuy nhiên người dùng sẽ cần phải có một ảnh mẫu để trích chọn và biểu diễn các đặc trưng trong bức ảnh đó trước khi tìm kiếm. Tìm kiếm ảnh theo nội dung là một phương pháp mới, hiệu quả để tìm ra những kết quả hình ảnh tương tự với thông tin được lấy trực tiếp từ nội dung của ảnh. Nói chung, đối với hệ thống này người dùng sẽ cung cấp ảnh truy vấn và hệ thống sẽ trả về kết quả là tập các ảnh tương tự. Do đó, làm thế nào để mô tả, mô hình một hình ảnh để so sánh các ảnh khác nhau và đánh chỉ số cho các ảnh trong
  • 15. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 2 cơ sở dữ liệu và để tìm kiếm ảnh một cách hiệu quả là một vấn đề hết sức quan trọng. Đây là bài toán đặt ra và đang được xã hội quan tâm. Vì vậy, nghiên cứu phương pháp tìm kiếm ảnh dựa trên một số đặc trưng cho trước trong tập dữ liệu lớn được mạnh dạn đề xuất nghiên cứu trong đề tài này. 1.2 Mục tiêu của đề tài Nghiên cứu các kỹ thuật tìm kiếm ảnh theo nội dung và đề xuất mô hình tìm kiếm ảnh trong tập dữ liệu ảnh lớn dựa trên đặc trưng ảnh. 1.3 Nội dung đề tài Tìm kiếm ảnh theo một vài đặc điểm của ảnh trong tập dữ liệu lớn là một công đoạn quan trọng trong rất nhiều ứng dụng thị giác máy tính. Những hệ thống thuộc loại này có thể kể ra như là: tìm kiếm ảnh trên internet, tìm kiếm ảnh y khoa trong bệnh viện theo đặc điểm của bệnh nhân, hệ thống giao diện người dùng dựa vào cảm nhận, những căn phòng thông minh và những hệ thống thông minh hỗ trợ tài xế lái xe tự động, .... Nội dung chính của đề tài là nghiên cứu phương pháp nhằm tìm kiếm ảnh dựa trên một số đặc điểm được mô tả trước trong tập dữ liệu ảnh lớn. 1.4 Giới hạn của đề tài Nghiên cứu một số kỹ thuật tìm kiếm ảnh, đặc biệt là các kỹ thuật tìm kiếm ảnh dựa vào màu sắc, cấu trúc và nội dung của ảnh. Tìm kiếm ảnh dựa trên các đặc trưng cơ bản như màu sắc, hình dạng cũng như cấu trúc. 1.5 Phương pháp nghiên cứu Phương pháp nghiên cứu được sử dụng: định tính, định lượng và so sánh kết quả với các giải thuật khác. Tìm kiếm tài liệu liên quan trên Internet, các bài báo, kỷ yếu, các báo cáo hội thảo, hội nghị trong nước và trên thế giới có liên quan đề tài. Nghiên cứu một số kỹ thuật tra cứu ảnh cần thiết và cài đặt chúng, đánh giá và so sánh với các kỹ thuật đang tồn tại. Khảo sát yêu cầu bài toán, từ đó phân tích và thiết kế bài toán. Trao đổi với các chuyên gia về lĩnh vực tìm kiếm ảnh theo nội dung ảnh.
  • 16. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 3 Sử dụng công cụ Matlab để tiến hành hiện thực giải thuật để thu thập kết quả. 1.6 Cấu trúc luận văn Luận văn được tổ chức thành 5 chương như sau: Chương 1: Giới thiệu khái quát vấn đề được đề cập trong luận văn; trình bày mục tiêu, nội dung thực hiện, giới hạn của đề tài và phương pháp nghiên cứu. Chương 2: Trình bày các cơ sở lý thuyết và các nghiên cứu liên quan trong và ngoài nước. Chương 3: Trình bày chi tiết về phương pháp đề xuất trong luận văn. Chương 4: Trình bày kết quả thực nghiệm, đánh giá hiệu quả của giải thuật đề xuất. Chương 5: Dựa trên các kết quả đạt được để kết luận, trình bày ưu và nhược điểm của giải thuật đề xuất, hướng mở rộng cho đề tài.
  • 17. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 4 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN 2.1 Cơ sở lý thuyết Phương pháp tìm kiếm ảnh dựa trên nội dung có thể được phân thành các lớp phụ thuộc vào các đặc trưng như màu sắc, kết cấu và hình dạng như hình 2.1. Mỗi lớp đặc trưng được chia thành các lớp con tùy theo sử dụng thuật toán để xây dựng các véc tơ đặc trưng. Đặc trưng hình dạng được chia làm 02 đặc trưng: đặc trưng biên và đặc trưng vùng. Trong nghiên cứu, các nhà nghiên cứu phân loại các đặc trưng không gian của ảnh trong một lớp riêng biệt. CBIR Methods Colour atures Texture atures Shape eatures Histogram Statistical Slectral Statistical Model Boundary Region based Features Features Features based based base Hình 2.1: Mô hình phân lớp của CBIR 2.1.1 Đặc trưng màu sắc Đặc trưng màu sắc là một trong những đặc trưng quan trọng nhất của việc tìm kiếm tập ảnh màu của đối tượng nội dung bất kỳ. Màu sắc đóng vai trò rất quan trọng trong cơ chế nhận thức thị giác của con người. Một ảnh màu điển hình được lấy từ camera số hoặc download từ Internet thường có ba kênh màu (ảnh xám chỉ có một kênh), những giá trị của dữ liệu ba
  • 18. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 5 chiều này từ ảnh màu có thể cho ta biết vị trí của những điểm ảnh này trong không gian màu. Những điểm ảnh có giá trị (1, 1, 1) cho những màu khác nhau trong những không gian màu khác nhau. Như vậy, mô tả đầy đủ của một ảnh màu điển hình gồm thông tin không gian hai chiều với điểm ảnh trong vùng không gian này và dữ liệu màu ba chiều với điểm ảnh màu trong không gian mà chúng ta đang đề cập. Ở đây giả thuyết không gian màu là cố định, bỏ qua thông tin không gian, thông tin màu trong ảnh có thể coi như là tín hiệu ba chiều đơn giản. Nếu chúng ta coi thông tin màu của ảnh là tín hiệu một, hai, hoặc ba chiều đơn giản thì việc phân tích các tín hiệu sử dụng ước lượng mật độ xác xuất là một cách dễ nhất để mô tả thông tin màu của ảnh. Tất cả các phương pháp biểu diễn đặc trưng màu sắc của một ảnh có thể được phân thành hai nhóm: biểu đồ màu và phương pháp thống kê biểu đồ màu. Các không gian màu thường được sử dụng nhiều nhất như: * Không gian màu chuẩn RGB Mắt người có thể phân biệt hàng ngàn màu sắc khác nhau, những con số chính xác hơn vẫn còn đang được bàn cãi nhiều. Ba màu RGB (Red – Green- Blue) mã hóa hệ thống đồ họa sử dụng ba byte (28 ) hay khoảng chừng 16 triệu màu phân biệt. Máy tính có thể phân biệt bất kỳ màu gì sau khi được mã hóa, nhưng việc mã hóa có thể không trình bày được những sự khác biệt trong thế giới thực. Mỗi điểm ảnh RGB bao gồm một byte cho màu R, một byte cho màu G và một byte cho màu B. Việc mã hóa một màu tùy ý trong dãy hiển thị được làm bằng cách tổ hợp ba màu chính. Ví dụ: Red(255,0,0), Green(0,255,0), Blue(0,0,255), Black(0,0,0). Hệ thống màu RGB là một hệ thống màu cộng vào bởi vì mỗi màu được tạo nên bằng cách cộng thêm các phần tử vào màu đen(0,0,0). Khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số, lý do chính là tính tương thích với màn hình hiển thị chính là màn hình vi tính. Tuy nhiên không gian màu RGB có hạn chế lớn
  • 19. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 6 nhất là không phù hợp với cách con người cảm nhận về màu sắc. Do đó, không phù hợp cho việc ứng dụng vào tìm kiếm ảnh. * Hệ thống màu CMY Hệ thống màu CMY theo mô hình in trên giấy trắng và theo khuôn mẫu trừ từ màu trắng thay vì thêm vào từ màu đen như hệ thống màu RGB. CMY là viết tắt của Cyan-Magenta-Yellow (màu lục lam, màu đỏ tươi, màu vàng), đó là ba màu chính tương ứng với ba màu mực in. Cyan hấp thu sự chiếu sáng của màu đỏ, Magenta hấp thu màu xanh lục, Yellow hấp thu màu xanh dương. Do đó, tạo ra sự phản ánh tương ứng như khi in ảnh được chiếu sáng với ánh sáng trắng. Hệ thống dưới dạng âm tính vì mã hóa theo dạng hấp thụ màu. Có một số mã hóa như sau: trắng (0,0,0) vì không có ánh sáng trắng được hấp thụ, đen (255,255,255) vì tất cả các thành phần của màu trắng đều được hấp thụ. Hệ thống màu CMY dường như là một sự đảo ngược của hệ thống màu RGB. Đặc tính của nó là sự đơn giản, ứng dụng nhiều trong thực tế. Tuy nhiên khuyết điểm của nó cũng tương tự như không gian màu RGB, tức là cách mã hóa khác với cách mà con người cảm nhận về màu sắc. Không thích hợp cho bài toán tìm kiếm ảnh dựa vào nội dung. * Hệ thống màu L*a*b: Mô hình L*a*b được đề cử bởi CIE cho việc lượng hóa sự khác biệt của màu sắc trong vật chiếu sáng của ánh sáng ban ngày. Tuy nhiên nó có một sự chuyển đổi được ghi vào để mà tính toán cho việc thích nghi với những nguồn sáng. Đây là hệ thống màu có sự tách riêng ánh sáng và màu sắc ra riêng. Do đó, cũng có khả năng lớn cho việc tìm kiếm dựa vào nội dung. * Hệ thống màu HSI: Hue-Saturation-Intensity Hệ thống màu HSI mã hóa thông tin màu sắc bằng cách chia giá trị intensity I từ hai giá trị được mã hóa thuộc về độ hội tụ của màu- hue H và saturation S. Thành phần không gian màu HSI gồm có ba phần: Hue được định nghĩa có giá trị 0-2Π, mang thông tin về màu sắc. Saturation có giá trị 0-1, mang giá trị về độ thuần khiết của thành phần Hue. Intensity (Value) mang thông tin về độ sáng của
  • 20. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 7 điểm ảnh.Ta có thể hình dung không gian màu HSI như là vật hình nón. Với trục chính biểu thị cường độ sáng Intensity. Khoảng cách đến trục biểu thị độ tập trung Saturation. Góc xung quanh trục biểu thị cho sắc màu Hue. Đôi khi, hệ thống màu HSI được coi như là hệ thống màu HSV dùng Value thay vì Intensity. Hệ thống màu HSI thì thích hợp hơn với một số thiết kế đồ họa bởi vì nó cung cấp sự điều khiển trực tiếp đến ánh sáng và hue. Hệ thống màu HSI cũng hỗ trợ tốt hơn cho những thuật toán xử lý ảnh vì sự tiêu chuẩn hóa về ánh sáng và tập chung vào hai tham số về độ hội tụ màu và cường độ màu. Hệ thống màu HSI có sự phân chia rõ rệt giữa ánh sáng và màu sắc. Do đó có khả năng rất lớn được áp dụng cho việc tính đặc trưng và so sánh sự giống nhau về màu sắc của hai ảnh. Do đó nó rất thích hợp cho việc tìm kiếm ảnh dựa vào màu. Sự giống và khác nhau giữa hai ảnh về mặt màu sắc đối với mắt người chỉ mang ý nghĩa tương đối. Do đó khi áp dụng vào bài toán này trên máy tính thì ta cũng giả lập sự tương đối này. Phương pháp chính của việc tìm kiếm theo màu sắc là dùng lược đồ màu để làm đặc trưng cho từng ảnh. Do những đặc điểm riêng của mô hình màu HSI và đặc trưng của việc tìm kiếm nên tính lược đồ màu cũng được dùng một mô mình rất đặc biệt để phù hợp cho những đặc điểm riêng này. Cách đơn giản và sử dụng thường xuyên nhất để biểu diễn cho màu sắc là biểu đồ màu. Biểu đồ màu là một bảng tóm tắt thông tin vềmàu sắc cho một ảnh màu bất kỳ. Đối với mỗi điểm của không gian màu sắc, số lượng điểm ảnh của một màu được tính toán nhất định. Các thông tin về màu sắc thường đơn giản và tự nhiên.Tuy nhiên, nó có nhược điểm là khoảng cách độ tương đồng giữa hai hình ảnh có màu sắc giống nhau là lớn. Ngoài ra, biểu đồ như vậy là rất thưa thớt và do đó dễ bị nhiễu. Stricker và Orengo đề xuất sử dụng biểu đồ màu tích lũy [1]. Một biểu diễn màu sắc như vậy là ít nhiễu và cũng làm giảm số lượng các lỗi Type II nếu các phần tử liền kề của biểu đồ tương ứng với màu sắc tương tự. Một phương pháp tiếp cận khác để tính độ tương đồng của màu sắc được trình bày trong [2]. Trong tác phẩm này, số
  • 21. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 8 liệu khác dựa trên không gian véc tơ của màu sắc (biểu đồ) được đề xuất. Các biểu đồ màu tự nó không lưu trữ thông tin về cách bố trí không gian của màu sắc vào hình ảnh. Một giải pháp cho vấn đề này đã được đề xuất trong [3]. Sau khi xây dựng một biểu đồ màu nơi mà chỉ có màu chính của một hình ảnh được xem xét cho mọi phần tử khác không của biểu đồ, tọa độ của khối tâm của vùng màu tương ứng được tính toán. Thông tin này được sử dụng để đo độ tương đồng giữa các hình ảnh với số lượng điểm ảnh thuộc vùng màu này. Giải pháp này có thể thực hiện, trong một nghĩa nào đó, phải được xem xét bố trí không gian của màu sắc, nhưng nó có một bất lợi đáng kể. Nếu hình ảnh có chứa một số thành phần hợp nhất của cùng một màu sắc, thực tế này sẽ không được phản ánh trong các véc tơ đặc trưng của ảnh. Thay vào đó, một khối tâm chung cho tất cả các thành phần sẽ được tính toán. Một sự thay đổi của mô hình này đã được đề xuất bởi Stricker và các cộngsự trong [4]: kênh phân phối các màu riêng biệt được coi là một phần của một phân phối ba chiều chứ không phải là phân phối độc lập. Cho véc tơ đặc trưng, giá trị trung bình cho mỗi kênh màu và ma trận đồng nhất của kênh phân phối được sử dụng. Để lấy đồ họa và hình ảnh cùng lúc, công việc này được áp dụng một phương pháp truy hồi thích nghi [5]. Các phương pháp được đề xuất sử dụng Histogram of oriented gradients (HOG) như các đặc trưng dựa trên điểm ảnh. Tuy nhiên, đặc điểm của đồ họa và hình ảnh là khác nhau, điều này ảnh hưởng đến trích xuất đặc trưng và độ chính xác truy xuất. Như vậy, một phương pháp thích hợp được đề nghị chọn đặc trưng khác nhau dựa trên HOG cho truy xuất đồ họa và hình ảnh. Trong [6], một phương pháp trích chọn đặc trưng màu sắc và kết cấu của hình ảnh một cách nhanh chóng cho truy xuất ảnh dựa trên nội dung (CBIR) được đề xuất. Đầu tiên, không gian màu HSV được định lượng một cách hợp lý. Biểu đồ màu và đặc trưng kết cấu dựa trên ma trận đồng nhất được trích xuất từ véc tơ đặc trưng. Sau đó, các đặc điểm của biểu đồ màu sắc toàn cục, đặc trưng kết cấu biểu đồ màu cục bộ được so sánh và phân tích cho CBIR. Dựa trên những sản phẩm này, một hệ thống CBIR được thiết kế sử dụng đặc trưng màu sắc và kết cấu hợp nhất bằng cách xây dựng trọng số của véc tơ đặc trưng.
  • 22. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 9 Trong [7], các đặc trưng như hình dạng và kết cấu được so sánh bằng khoảng cách Euclide giữa ảnh truy vấn và ảnh tham chiếu. Các thao tác hình thái với cấu trúc phần tử ảnh bất biến không gian được sử dụng cho trích xuất đặc trưng. Sau khi quá trình trích xuất đặc trưng, các véc tơ đặc trưng được tính toán bằng cách áp dụng phương pháp mã hóa xử lý khối (BTC) trong trích xuất đặc trưng hình ảnh. Nó cải thiện hiệu suất của truy xuất hình ảnh và giảm độ phức tạp tính toán để thực hiện truy vấn. Dựa trên mô hình màu HSV, một phương pháp dựa trên đối tượng đặc trưng không gian màu (OSCF) cho truy xuất màu của ảnh được đề xuất trong [8]. Thứ nhất, đối tượng này được trích xuất từ màu sắc, sau đó là các đặc trưng hình ảnh biểu diễn bởi các đối tượng trong nó. Màu sắc và đặc trưng không gian màu được áp dụng để mô tả các đối tượng. Phương pháp mới chỉ quan tâm đến các đối tượng chính trung tâm. Trong [9], tác giả đề xuất một cách tiếp cận mờ mới để phân loại màu sắc hình ảnh dựa trên nội dung của nó, để đặt ra một truy vấn về ngôn ngữ tự nhiên và kết hợp các truy vấn dựa trên mạng lưới thần kinh để truy xuất nhanh chóng và hiệu quả. Một phương pháp truy xuất dựa trên hình ảnh màu mới được đề xuất trong [10]. Độ chính xác của thuật toán này là cao hơn so với phương pháp học có giám sát và hiệu quả của nó cũng hơn cách học có giám sát. Thứ nhất, thông qua các ma trận khoảng cách của màu sắc, ảnh mẫu được phân cụm lại theo cách tự tổ chức, do đó bảng màu của nó được xây dựng. Dựa trên bảng màu này, hình ảnh khác trong cơ sở dữ liệu được ánh xạ về khoảng cách nhỏ nhất. Bằng cách này, một biểu đồ chuẩn theo bảng màu giống nhau có thể được thu được cho mỗi hình ảnh trong cơ sở dữ liệu. Bên cạnh đó, thuật toán này cũng kết hợp các vùng màu chính để đại diện cho phân bố không gian của màu sắc. Trong [11], tác giả đã thảo luận về các phương pháp so sánh được sử dụng trong biểu đồ màu sắc dựa trên hai phương pháp chính được sử dụng thường xuyên trong CBIR: biểu đồ màu sắc chuẩn bằng cách sử dụng GLCM và biểu đồ màu sắc sử dụng KMeans. Sử dụng khoảng cách Euclide để tính toán sự giống nhau giữa hình ảnh truy vấn và các hình ảnh ứng viên. Kết quả thí nghiệm cho
  • 23. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 10 thấy rằng biểu đồ màu sắc với phương pháp K-Means có độ chính xác cao và chính xác so với GLCM. Trong [12], một phương pháp được đề xuất để truy xuất ảnh nhị phân, đối với phương pháp này thì ảnh đen và trắng được biểu diễn bởi một tên đặc trưng mới cho biểu đồ phân cấp mật độ thích nghi, trong đó khai thác sự phân bố của các điểm ảnh trên một miền hai chiều. Một loại biểu đồ mới trong đó kết hợp chỉ có các thông tin thị giác ngoại vi cạnh của các hình ảnh được giới thiệu trong [13]. Các thao tác trích xuất cạnh được thực hiện với việc sử dụng điều khiển bao quanh trung tâm của hệ thống thị giác con người. Các biểu đồ màu quanh trung tâm (Center-Surround Histogram - CSH) được đề nghị có hai ưu điểm so với biểu đồ kinh điển. Đầu tiên, nó làm giảm số lượng thông tin trực quan cần phải được xử lý lần hai, nó kết hợp một mức độ của thông tin không gian khi được sử dụng trong các ứng dụng truy xuất hình ảnh dựa trên nội dung. Một truy xuất hình ảnh mạnh mẽ dựa trên biểu đồ màu sắc của đặc trưng vùng cục bộ (LFR) được trình bày trong [14]. Thứ nhất, điểm đặc trưng ảnh ổn định được trích xuất bằng cách sử dụng bộ điều chỉnh đa tỷ lệ Harris-Laplace. Sau đó, các vùng đặc trưng chữ ký cục bộ được xác định thích nghi theo tỉ lệ đặc trưng lý thuyết. Cuối cùng, các biểu đồ màu sắc của vùng đặc đặc trưng cục bộ được cấu thành, sự giống nhau giữa các hình ảnh màu được tính bằng cách sử dụng các biểu đồ màu của LFRs. Một hệ thống CBIR mới được đề xuất trong [15] tên là iSearch và đối sánh toàn cục/cục bộ của các đặc trưng cục bộ được kết hợp để truy xuất hình chính xác. Nhiều đặc trưng cục bộ được trích xuất bao gồm phép biến đổi đặc trưng bất biến (SIFT), moment vùng màu và đối tượng phân mãnh đường viền đủ để biểu diễn xuất hiện thị giác của các phần tử; trong khi đối sánh toàn cục và cục bộ của hình ảnh trong bộ dữ liệu là lớn. Để làm điều này, một mã hóa phân mãnh đường viền hiệu quả và phương pháp lập chỉ mục được phát triển. 2.1.2 Đặc trưng kết cấu Kết cấu là một khái niệm trực quan, là một thành phần chủ yếu về nhận thức thuộc tri giác của con người. Giống như màu sắc, kết cấu trở thành đặc điểm cần
  • 24. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 11 thiết để xem xét khi truy vấn cơ sở dữ liệu ảnh. Mọi người đều có thể nhận thấy kết cấu tuy nhiên nó rất khó để xác định, điều này được thể hiện bằng một số khái niệm khác nhau về kết cấu. Mặc dù không có một khái niệm chung cho kết cấu nhưng tất cả các nhà nghiên cứu đều tập trung thống nhất trên hai điểm chính: - Trong phạm vi một kết cấu có sự biến đổi đáng kể về mức độ cường độ giữa các điểm ảnh liền kề, đó là giới hạn của độ phân giải, không có sự đồng nhất. - Kết cấu là thuộc tính đồng nhất ở một vài không gian lớn hơn độ phân giải của ảnh, hàm ý trong những thuộc tính này của cấu trúc là ảnh có độ phân giải nhất định. Khác với màu sắc, kết cấu diễn ra trên cả một vùng hơn là tại một điểm, nó thường được định nghĩa bằng những mức xám được hiểu như là màu sắc. Một số nhà nghiên cứu giải quyết bài toán về xác định kết cấu bằng cách mô tả nó trong những thuật ngữ của hệ thống thị giác của con người như hướng, độ thô, độ tương phản…. Một số nhà nghiên cứu khác lại định nghĩa kết cấu bởi những ứng dụng. Điều này tạo cho kết cấu đa dạng và cho nhiều cách để trích chọn kết cấu. Định nghĩa của kết cấu dựa trên nhận thức của con người là phù hợp cho nghiên cứu và cho bàn luận về nét tự nhiên của kết cấu. Mặc dù vậy một định nghĩa đưa ra những vấn đề khi được sử dụng như là học thuyết cơ bản cho thuật toán phân tích kết cấu. Kết cấu cho chúng ta thông tin về sự sắp xếp cấu trúc của bề mặt và các đối tượng trên hình ảnh. Kết cấu không được định nghĩa cho một điểm ảnh riêng biệt; nó phụ thuộc vào sự phân bố cường độ lên ảnh. Kết cấu sở hữu tính chu kỳ và tính khả năng mở rộng; nó có thể được mô tả bởi hướng cơ bản, độ tương phản, và độ sắc nét. Phân tích kết cấu đóng vai trò quan trọng trong việc so sánh các hình ảnh bổ sung các đặc trưng màu sắc. Thống kê các đặc trưng thường được sử dụng nhất bao gồm: - Các thông số tổng hợp thống kê tính toán từ các giá trị cường độ điểm ảnh. - Thông số tính toán dựa trên các ma trận đồng xuất hiện. - Biểu đồ kết cấu xây dựng dựa trên các đặc trưng Tamura.
  • 25. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 12 Một trong những phương pháp đầu tiên để biểu diễn cho các đặc trưng kết cấu của hình ảnh là các ma trận đồng nhất xám(GLCM) đề xuất bởi Haralick và các cộng sự. [16]. Các tác giả đề xuất 14 mô tả, bao gồm hai moment gốc, tương phản (bất biến, moment khác), tương quan và những vấn đề khác. Mỗi mô tả biểu diễn cho một thuộc tính kết cấu. Vì thế, nhiều công trình ví dụ như mô tả trong [17], được dành cho việc lựa chọn thống kê mô tả có nguồn gốc từ các ma trận đồng nhất, mô tả kết cấu một cách tốt nhất. Trong [18], trước hết, chuyển không gian màu từ mô hình RGB đến mô hình HSI, sau đó trích xuất biểu đồ màu tạo thành véc tơ đặc trưng màu. Thứ hai, trích xuất đặc trưng kết cấu bằng cách sử dụng ma trận đồng nhất xám. Thứ ba, áp dụng moment Zernike để trích xuất các đặc trưng hình dạng. Cuối cùng, kết hợp màu sắc, kết cấu và đặc trưng hình dạng để tạo thành các véc tơ đặc trưng hợp nhất của toàn bộ hình ảnh. Các thực nghiệm trên được sử dụng cho bộ dữ liệu hình ảnh cho thấy kế hoạch đề xuất đạt được một hiệu suất rất tốt về độ chính xác truy xuất so với các phương pháp khác. Một phương pháp được đề xuất [19] cho truy xuất hình ảnh hiệu quả áp dụng một sự kết hợp có trọng số của màu sắc và kết cấu cho các biến đổi wavelet, dựa trên không gian màu và thứ tự thống kê tương ứng. Bộ mô tả đề xuất là đặc biệt hữu dụng cho việc tìm kiếm hình ảnh đa độ phân giải. Mô tả kết cấu dựa trên Wavelet Trong mô tả kết cấu dựa trên wavelet, một đặc trưng cụ thể của phương pháp này là biểu diễn và phân tích các tín hiệu với tỷ lệ khác nhau, tức là, theo độ phân giải khác nhau. Các hình ảnh được mô tả bởi một cấu trúc phân cấp, mỗi cấp biểu diễn cho các tín hiệu gốc với một mức độ chi tiết. Smith và Chang sử dụng đặc điểm thống kê (trung bình và bất biến) tính toán cho mỗi dải con như là đặc trưng kết cấu [20]. Họ đã so sánh hiệu quả của phân loại kết cấu cho các đặc trưng được xây dựng bằng cách tiếp cận phương pháp wavelet, phân tích đồng nhất vào dải con (mà không mở rộng quy mô, mỗi dải con có chứa một phần của một tín hiệu của tần số nhất định), biến đổi rời rạc cosin, phân tích không gian. Trong [21], hệ số phân phối độ lệch trung bình và tiêu chuẩn của biến
  • 26. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 13 đổi wavelet được sử dụng để xây dựng các véc tơ đặc trưng. Trong trường hợp chuyển đổi với các bộ lọc N, hình ảnh được biểu diễn bởi một véc tơ đặc trưng của 2N chiều. Trong [22], tác giả tính toán một đặc trưng kết cấu mới bằng cách áp dụng hàm mật độ Gauss chung đến sự phân bố của hệ số Curvelet được gọi là đặc trưng kết cấu Curvelet GGD. Mục đích là để nghiên cứu đặc trưng kết cấu curvelet GGD và so sánh hiệu suất truy xuất của Curvelet, Wavelet và đặc trưng kết cấu Wavelet GGD. Kết quả thí nghiệm cho thấy rằng cả hai curvelet và các đặc trưng curvelet GGD thực hiện tốt hơn đáng kể so với đặc trưng kết cấu wavelet và Wavelet GGD. Trong số hai loại đặc trưng dựa trên curvelet, trong CBIR đặc trưng curvelet có hiệu suất làm tốt hơn hơn đặc trưng kết cấu curvelet GGD. Công việc bao gồm việc giảm thiểu các đặc trưng cấp thấp mô tả một hình ảnh bằng cách sử dụng một mô tả giảm kết hợp thông tin màu sắc và kết cấu đó là chuyển đổi wavelet được khám phá trong [23]. Một phương pháp được đề xuất để mô tả ảnh bởi các dải con tần số cao là biến đổi Wavelet rời rạc (DWT) liên quan đến các khu vực trọng số nổi bật sau một bước phân đoạn mờ. Trong [24], một chữ ký hình ảnh đơn giản dựa trên những moment chuẩn của phân bố hệ số Wavelet được đề xuất. Chữ ký này có thể được tính cho mỗi thể wavelet lọc nhanh. Do đó một bản đồ chữ ký hình ảnh thu được được sử dụng như là một đặc tính hình ảnh cho tìm kiếm hình ảnh dựa trên nội dung (CBIR). Việc biểu diễn phép biến đổi Curvelet (MCT) và sự kết hợp với cây từ vựng (VT) cho bộ sưu tập đặc trưng và truy xuất các hình ảnh từ cơ sở dữ liệu [25]. MCT đã được thực hiện bằng cách sử dụng dải con Gabor wavelet. Các thuật toán đề xuất bắt thông tin cạnh trong một hình ảnh chính xác hơn Gabor transform (GT) và chuyển đổi Curvelet trong đó sử dụng thuật giải a trous cho biến đổi Wavelet (ACT) cho phân tích của một ảnh. Trong đề xuất [26], một kỹ thuật tìm kiếm thông minh dựa trên meta-heuristic, hybrid, được gọi là hỗn hợp Thuật toán tìm kiếm hấp dẫn (MGSA), được sử dụng. Một số thông số trích xuất đặc trưng được tối ưu hóa để đạt được độ chính xác tối
  • 27. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 14 đa của hệ thống CBIR. Một hệ thống CBIR cực kỳ nhanh chóng trong đó sử dụng tập hợp Multiple Support Vector Machines (MSVM) được đề xuất trong [27]. Tác giả sử dụng phép biến đổi wavelet Daubechies để trích xuất véc tơ đặc trưng của hình ảnh. Trong [28], một cơ sở wavelet khác được sử dụng để mô tả từng ảnh truy vấn. Một hàm hồi quy được sử dụng để điều chỉnh hiệu suất tối đa truy xuất trong các tập dữ liệu huấn luyện, nó sử dụng để ước tính tốt nhất bộ lọc wavelet về mặt hiệu suất truy xuất dự kiến cho mỗi hình ảnh truy vấn. Tamura và các cộng sự. [29] trình bày một cách tiếp cận để mô tả kết cấu trên cơ sở nhận thức về thị giác con người. Họ đề nghị sáu tham số: thô, độ tương phản, hướng từ, dòng giống, đều đặn, và độ nhám tương ứng với sáu thuộc tính kết cấu đã được công nhận là ý nghĩa thị giác trong quá trình thí nghiệm tâm lý. Howarth và Ruger [30] - [31] nhận thấy rằng các thông số mô tả ba đặc tính đầu tiên: tính thô, độ tương phản và tính định hướng có hiệu quả hơn trong phân loại và tìm kiếm hình ảnh bởi kết cấu. Tập hợp của tất cả các điểm đó của một hình ảnh được đưa ra như ảnh Tamura. Phân tích kết cấu bằng phương pháp của các bộ lọc Gabor là một trường hợp đặc biệt của phương pháp wavelet và được sử dụng thường xuyên trong truy xuất ảnh bởi kết cấu. Trong hầu hết các hệ thống CBIR dựa trên Gabor wavelet [32] - [34], hệ số phân phối giá trị trung bình và độ lệch chuẩn của biến đổi wavelet được sử dụng để tạo các véc tơ đặc trưng. Trong trường hợp chuyển đổi với các bộ lọc N, hình ảnh được biểu diễn bởi một véc tơ đặc trưng 2 N chiều. Ý tưởng khác của hệ thống CBIR được dựa trên việc mở rộng các hình ảnh trong điều kiện cơ sở thu được bằng cách phân tích một tập huấn luyện của ảnh. Ví dụ là bộ lộc thông dụng ICA bằng cách áp dụng các thành phần phân tích độc lập của tập huấn luyện. Cách các bộ lọc ICA được xây dựng tương tự như quá trình huấn luyện của hệ thống thị giác con người. Các bộ lọc ICA thu được bằng phân tích thành phần cạnh biên cục bộ độc lập và tương tự như các bộ lộc Gabor. Không giống như cách thứ hai, các bộ lọc ICA được tạo tự nhiên
  • 28. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 15 và phản ánh tính chất kết cấu chính của ảnh đã được sử dụng để có được chúng. Việc xây dựng các bộ lọc ICA có thể được tìm thấy trong [35-38]. Ba đặc trưng ảnh được đề xuất để truy xuất ảnh trong [39]. Các đặc trưng ảnh đầu tiên và thứ hai là dựa trên đặc trưng màu và kết cấu, lần lượt gọi là ma trận đồng nhất màu (CCM) và sự khác biệt giữa các điểm ảnh của mẫu ảnh (DBPSP). Các đặc trưng ảnh thứ ba là dựa trên phân phối màu sắc, được gọi là biểu đồ màu K-mean (CHKM). Trong [40], đầu tiên không gian màu HSV được định lượng hợp lý, Biểu đồ màu và đặc trưng kết cấu dựa trên ma trận đồng nhất được trích xuất từ véc tơ đặc trưng. Sau đó, các đặc điểm của biểu đồ màu cục bộ, biểu đồ màu cục bộ và đặc trưng kết cấu được so sánh và phân tích cho CBIR. Dựa trên kết quả công việc này, một hệ thống CBIR được thiết kế sử dụng màu sắc và kết cấu hợp nhất các đặc trưng bằng cách tạo trọng số của các véc tơ đặc trưng. Trong [41], một phương pháp truy vấn ảnh dựa trên nội dung được đề xuất dựa trên hiệu quả tích hợp của đặc trưng màu sắc và kết cấu. Một sơ đồ đặc trưng mới sử dụng biểu đồ Gabor wavelet nâng cao (EGWC) được đưa ra lập chỉ mục và truy xuất ảnh trong [42]. EGWC sử dụng Gaborwavelets để phân tích các hình ảnh theo tỉ lệ định hướng khác nhau. Các hệ số Gabor wavelet được lượng tử hóa bằng cách tối ưu ngưỡng lượng tử. Trong bước tiếp theo, biểu đồ màu của hệ số lượng tử hóa wavelet được tính trong từng tỷ lệ và định hướng wavelet. Một phương pháp mới được đề xuất trong đó sử dụng một thuật toán phân cụm k-means nổi tiếng và một cơ sở dữ liệu chỉ mục cấu trúc B ± cây để tạo điều kiện lấy hình ảnh có liên quan một cách hiệu quả [43]. Trong [44], một đặc trưng bất biến xoay curvelet đại diện cho kết cấu được đề xuất làm tốt hơn và được sử dụng rộng rãi so với đặc trưng kết cấu Gabor. Một phương pháp mới cũng được đề nghị áp dụng phép biến đổi curvelet để phân vùng ảnh truy xuất. Một phương pháp được đề xuất gần đây nhất của hệ thống CBIR là sử dụng nhiều máy véc tơ hổ trợ (Multiple Support Vector Machines) [45]. Phép biến đổi wavelet Daubechies wavelet trích xuất các véc tơ đặc trưng của ảnh. Truy vấn ảnh dựa trên nội dung (CBIR) để hỗ trợ chẩn đoán trong lĩnh vực y học được
  • 29. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 16 trình bày trong [46]. Trong hệ thống đề xuất, hình ảnh được lập chỉ mục trong lĩnh vực thời trang mà không cần trích xuất đặc trưng miền: chữ ký được xây dựng cho mỗi ảnh từ phép biến đổi wavelet của nó. Những đặc điểm chữ ký của ảnh được phân phối hiệu quả qua phép biến đổi wavelet. Phép đo khoản cách được định nghĩa để so sánh hai chữ ký hình ảnh và lấy ảnh truy xuất tương tự trong cơ sở dữ liệu khi một hình ảnh truy vấn được gửi bởi một bác sĩ. 2.1.3 Đặc trưng hình dạng Cùng với đặc điểm màu sắc và kết cấu, hình dạng của các đối tượng (hình ảnh tương phản) cũng thường được sử dụng để so sánh hình ảnh. Phương pháp biểu diễn và mô tả hình dạng có thể được chia thành hai nhóm: các phương pháp bên ngoài, nó biểu diễn cho vùng trong giới hạn của đặc tính ngoài (ranh giới của nó) và những đặc tính nội bộ, trong đó biểu diễn cho vùng trong những điều khoản của nó đặc điểm nội bộ (các điểm ảnh bao gồm vùng). Các đặc trưng hình dạng được chia thành hai loại: mô tả đường biên và mô tả vùng. Hơn nữa chúng được phân loại như cấu trúc (a) và toàn cục (b). Mô tả đường biên toàn cục bao gồm chữ ký khác, mô tả Fourier và mô tả wavelet. 2.1.4 Mô tả Boundary - Các mã chuỗi: Nó mô tả một đối tượng đường biên như là một chuỗi các phân đoạn với một hướng nhất định. Để xây dựng một mã chuỗi, các hình ảnh được xếp chồng với một lưới, và các điểm biên xấp xỉ bởi các nút lưới gần nhất. Các đường phân đoạn kết nối các nút lân cận. - Chữ ký: Chữ ký là biểu diễn của một đối tượng đường biên hai chiều bằng hàm của một biến, được giả định là dễ dàng hơn để mô tả sự so với các đường biên hai chiều nguyên bản. - Mô tả Fourier: Các mô tả Fourier là một trong những phương pháp phổ biến nhất của đường viền tham số hóa. Các Ý tưởng cơ bản của phương pháp này bao gồm trong ứng dụng của Fourier rời rạc vào chữ ký và sử dụng Hệ số Fourier thu được như tham số mô tả các đường viền.
  • 30. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 17 Trong [15], một phương pháp mới được đề xuất có tên là iSearch và đối sánh toàn cục và cục bộ của các đặc trưng cục bộ được kết hợp để truy xuất chính xác hình ảnh kiểu tương tác. Đầu tiên tác giả trích xuất nhiều đặc trưng cục bộ bao gồm đặc trưng chuyển đổi bất biến (SIFT), những moment vùng màu và các phân mảnh đường viền đối tượng để biểu diễn hiệu quả cho sự xuất hiện trực quan các mục; khi kết hợp đối sánh toàn cục và cục bộ của hình ảnh bộ dữ liệu quy mô lớn được phép. Để nâng cao thuật toán SIFT, một cách tiếp cận mạnh mẽ được đề xuất để truy xuất hình ảnh dựa trên sự kết hợp của điểm hấp dẫn và thông tin cạnh trong [47]. Cách tiếp cận này là mạnh mẽ để dịch, luân chuyển và giữ một phần của đối tượng. Một mô tả đặc trưng biểu đồ màu A trous wavelet cho biểu diễn hình ảnh được sử dụng trong [48]. Bằng cách mở rộng hơn nữa trong mô tả này, mô tả cấy trúc á trous Gradient (AGSD) được đề xuất cho truy xuất ảnh dựa trên nội dung. Đặc trưng đơn giản hóa AGSD được tính toán với a trous wavelet một cách cục bộ. Các thông tin cục bộ của hình ảnh được trích xuất thông qua mô tả cấu trúc vi mô (MSD); nó tìm thấy mối quan hệ giữa pixel lân cận. Trong [49], một sơ đồ đặc trưng mới gọi biểu đồ màu Gabor wavelet nâng cao (EGWC) được đề xuất cho chỉ mục và truy xuất hình ảnh. EGWC sử dụng Gabor wavelet để phân tích các hình ảnh trong tỷ lệ và định hướng khác nhau. Các hệ số wavelet Gabor sau đó được lượng tử hóa bằng cách sử dụng các tối ưu hóa ngưỡng lượng tử. Trong tiếp theo bước, biểu đồ tương quan của các hệ số wavelet được lượng tử hóa trong từng tỷ lệ và định hướng wavelet. 2.1.5 Mô tả theo Vùng (Region) Vùng có thể được mô tả bằng các thông số hình học đơn giản, chẳng hạn như một khu vực. - Phương pháp dựa trên Lưới: Sajjanhar và Lu [50] đề xuất một phương pháp trực quan rõ ràng để mô tả hình dạng của đối tượng, gọi là phương pháp dựa trên lưới. Ý tưởng cơ bản của phương pháp được đề xuất có thể được thể hiện qua hai bước: một lưới với các tế
  • 31. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 18 bào của kích thước nhất định được đặt lên trên các đối tượng, và các tế bào của lưới điện nằm ngang từ cánh phải tới bên trái và từ trên xuống dưới. - Moments và bất biến của nó: Moment bất biến đang được sử dụng phổ biến nhất và mô tả vùng được sử dụng rộng rãi nhất. Ý tưởng sử dụng những Moment để mô tả hình dạng lần đầu tiên được đưa ra bởi Hu vào năm 1962 [51]. Tác giả coi những moment hình học của hàm có hai biến. Trong [52], Luren và Fritz đưa ra một phương pháp nhanh nhất để tính moment cho ảnh nhị phân dựa trên việc sử dụng bất biến mật mã của định lý Green. Trong [53], bất biến khác được suy ra từ những Moment hình học. Ngoài Moment hình học (chúng được đưa ra đôi khi là số ít hoặc số nhiều), những Moment khác cũng được sử dụng. Các Mô tả Fourier (GFD) được đề xuất bởi Zhang và Lu [54], như mô tả dựa trên moment khác, dựa vào ý tưởng mở rộng theo quan điểm cơ sở nhất định. Một phương pháp mới biểu diễn đặc trưng hình dạng dựa trên cạnh và xử lý hình thái học để truy xuất ảnh hiệu quả được trình bày trong [55]. Moment Pseudo Zernike dựa trên đặc trưng hình dạng toàn cục, nó là bất biến để biến đổi hình học cơ bản, được trích xuất và được sử dụng cho truy xuất hình ảnh tương tự với khoảng cách Canberra metric. Hệ thống CBIR được biểu diễn bằng cách sử dụng mô tả đặc trưng hình dạng và hiệu chỉnh moment Zernike dựa trên các moment Zernike với lỗi hình học tối thiểu và lỗi tích hợp số [56]. Trong [57], phân tích thí nghiệm của mô tả dày đặc điểm ảnh dựa trên như mô hình nhị phân cục bộ (LBP), mô hình tam phân cục bộ (LTP) và các biến thể của nó được thực hiện. Những mô tả này được sử dụng như là các đặc trưng cục bộ cùng với ZMS đặc trưng toàn cục đạt được tỷ lệ truy xuất cao hơn và chính xác trong hệ thống SBIR. Một phương pháp mới được đề xuất cho truy xuất ảnh theo nội dung dựa trên các điểm quan tâm [58]. Điểm quan tâm được phát hiện từ tỷ lệ hướng quay bình thường của ảnh. Sau đó, các hình ảnh bình thường được chia thành một loạt các vùng khu vực con với các vùng khác theo sự phân bố điểm quan tâm.
  • 32. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 19 2.2 Độ đo tương đồng 2.2.1 Độ đo về màu sắc Bước quan trọng của quá trình tìm kiếm dữ liệu ảnh dựa vào nội dung là xác định độ trùng khớp của hai lược đồ màu. Do đó, phát sinh ra một giá trị để biếu thị cho sự trùng khớp này, có nhiều cách để tính giá trị này. Ta gọi những giá trị được tính từ những cách khác nhau này là các loại độ đo màu. Một cách đơn giản, độ đo màu là được coi một giá trị để biểu thị cho độ so khớp sự trùng khớp của hai lược đồ màu. Tùy theo từng trường hợp, từng loại độ đo màu giá trị này có thể âm hoặc dương lớn hoặc nhỏ tương ứng với mức độ giống nhau như thế nào của các loại lược đồ màu. Mỗi loại độ đo màu có những ưu và khuyết điểm riêng, trong từng trường hợp cụ thể. Gọi h(I) và h(M) tương ứng là 2 lược đồ màu của hai ảnh I và ảnh M. Khi đó các loại độ đo màu được định nghĩa là một số nguyên (hoặc số thực) theo các loại độ đo tương ứng như sau:  Độ đo khoảng cách min - max  Được thực hiện dựa trên ý tưởng lấy phần giao của của hai lược đồ cần so sánh, ta sẽ được một lược đồ, tính tổng các giá trị có được từ lược đồ này cho ta được độ đo min-max. Đối với độ đo min: ta tính dựa vào giá trị min tại mỗi K bin. K Intersection(h(I),h(M))= min{h(I)[j],h(M)[j]} j=l Đối với độ đo max: ta tính dựa vào giá trị max tại mỗi K bin. K Intersection(h(I),h(M))= max{h(1)[j],h(M)[j]} j=l Matching(h(I),h(M)) Intersection(h(I),h(M)) max( h(I)[i],h(M)[i]) i i  Độ đo khoảng cách euclide  Đây là cách tính khoảng cách euclide thông thường giữa các K bin:
  • 33. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 20 K Intersection(h(I),h(M))= (h(I)-h(M))2 j=l Hoặc có thể là: K Intersection(h(I),h(M))= (h(I)-h(M))2 j=1 c. Độ đo khoảng cách toàn phương K K Intersection(h(I),h(M))=[(h(i)-h(i)]aij[h(i)-h(j)] i=1 j=1  Độ đo có trọng số  dhist(I,)=(h(I)-h(Q))T A(h(I)-H(Q)) Trong đó, h(I) và h(Q) là những lược đồ tương ứng của ảnh I và Q, và A là ma trận đồng dạng KxK. Trong ma trận này, những màu mà rất giống nhau thì gần với giá trị một, còn những màu rất khác nhau thì sẽ có giá trị gần với không. 2.2.2 Độ đo về kết cấu Dùng phương pháp tương quan tự động và quang phổ năng lượng để đo độ tương đồng về kết cấu. Hàm tương quan tự động của một ảnh có thể được dùng để dò tìm những phần tử hoa văn của vân và cũng đồng thời mô tả tính mịn/tính thô của vân. Hàm tương quan tự động ρ(dr,dc) của một ảnh với kích thước (N+1)x(N+1) với một độ dời d = (dr, dc) là:  N N I [ r , c ] I [ r dr , c dc] ( dr , dc) r 0 c 0  r N  0c N 0 I 2 [ r , c]  I [ r , c ]oI d [ r , c] I [ r , c ]oI [ r , c] Nếu vân ở dạng thô, khi đó hàm tương quan tự động sụt giảm chậm, ngược lại nó sẽ sụt giảm rất nhanh. Đối với những vân theo quy tắc, hàm tự động tương quan sẽ yếu. Khi I[r+dr, c+dc] không được xác định rõ là đường bao của ảnh, một phương pháp để tính toán những giá trị ảnh ảo phải đựợc định nghĩa.
  • 34. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 21 Hàm tự động tương tác liên quan với quang phổ nặng lượng của phép biến đổi Fourier. Nếu I[r,c] là hàm ảnh và F(u,v) là biến đổi Fourier của nó, F (u,v) 2 được coi như là năng lượng quang phổ. 2.2.3 Độ đo về hình dạng  Độ so khớp đường biên của hình dạng  Thuật toán so khớp đường biên đòi hỏi sự trích rút và trình bày đường biên của cả ảnh cần truy vấn và ảnh mang ra so khớp. Đường biên có thể được trình bày bởi một dãy những điểm ảnh hay có thể được xấp xỉ bởi một đa giác. Đối với một dãy những điểm ảnh, một loại so khớp cổ điển là dùng mô tả Fourier để so sánh hai hình dạng với nhau. Trong toán học hàm liên tục, mô tả Fourier là những hệ số của dãy triển khai Fourier của hàm mà định nghĩa đường biên của hình dạng ảnh. Trong trường hợp đặc biệt, hình dạng được trình bày bởi dãy của m điểm<V1 ,V2 ,...,Vm- 1>. Từ những dãy điểm này, một dãy của véc tơ đơn vị: vk V k1V k V k1V k và một dãy của những sai phân: k lkVi Vi1 , k 0 i1 l0 0 có thể được tính. Mô tả Fourier {a-M, ..., a0, ..., aM } sau đó được xấp xỉ bởi: 1 m an (v kl v k )e  jn (2 / L )lk n2 ) L( )2kl L Những mô tả này có thể được dùng để định nghĩa độ đo khoảng cách hình dạng. Giả sử, Q là ảnh truy vấn và I là ảnh mang hình dạng được so sánh với Q. Gọi { } là dãy của những mô tả Fourier cho ảnh truy vấn, và { } là mô tả Fourier cho ảnh. Khi đó, độ đo khoảng cách Fourier như sau:
  • 35. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 22 d ( I , Q ) m Fourie  1/ 2 an I  an Q 2    Như đã mô tả, khoảng cách này chỉ bất biến đối với phép tịnh tiến. Nếu mà những bất biến khác đòi hỏi, có thể dùng sự kết hợp với nhiều hàm số học thể giải quyết vấn đề tỷ lệ, xoay và điểm bắt đầu để cực tiểu hoá dFourier (I ,Q). Nếu đường biên được trình bày dưới dạng một đa giác, chiều dài của các cạnh và góc giữa chúng có thể được tính và dùng để trình bày hình dạng. Một hình dạng có thể được trình bày bởi một dãy những điểm nối liền nhau (Xi , Yi , αi), với cặp đường thẳng giao nhau tại điểm (Xi, Yi) với góc lớn αi. Cho một dãy Q = Q1, Q2, ..., Qn của những điểm nối liền nhau trình bày đường biên của đối tượng truy vấn Q và một dãy tương tự I = I1 , I2 , ..., Im trình bày đường biên của đối tượng I, mục tiêu là tìm một ánh xạ từ Q tới I mà ánh xạ từ dãy phân đoạn của ảnh truy vấn tới dãy có chiều dài tương tự phân đoạn của ảnh và sao cho cặp của dãy phân đoạn truy vấn gần kề mà gặp tại một góc đặc biệt α nên ánh xạ tới một cặp những dãy phân đoạn gần kề mà gặp nhau tại một góc α tương tự. Một kỹ thuật so khớp đường biên khác là so khớp mềm dẻo (elastic matching) trong đó hình dạng truy vấn được làm biến dạng để trở nên càng giống với hình dạng ảnh mẫu càng tốt. Sự cách biệt giữa hình dạng ảnh truy vấn và hình dạng của ảnh mẫu dựa vào hai thành phần chính: năng lượng đòi hỏi trong quá trình biến dạng từ hình dạng ảnh truy vấn tới mức độ phù hợp nhất với hình dạng trong ảnh mẫu. Và sự đo lường về độ giống nhau giữa hình dạng ảnh truy vấn sau khi bị biến dạng khớp với hình dạng trong ảnh mẫu.  So khớp ảnh phát họa  Hệ thống so khớp phát họa cho phép người dùng nhập vào một bản phát họa của những đường biên chính trong một ảnh và sau đó hệ thống sẽ tìm kiếm những ảnh màu hay ảnh xám mà có đường biên khớp nhất. Những ảnh màu được tiền xử lý như sau để đạt được một dạng trung gian gọi là ảnh được trích rút (abstract image).
  • 36. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 23 - Áp dụng phép biến đổi Affine để giảm kích thước ảnh về kích thước chỉ định trước. Dùng một mặt nạ trung vị để lọc nhiễu. Kết quả của bước này cho ra một ảnh được tiêu chuẩn hóa. - Sử dụng thuật toán dò biên để dò tìm đường biên dựa trên gradient. Dò biên được tiến hành qua hai bước: những biên toàn cục sẽ được tìm thấy trước tiên với một ngưỡng toàn cục dựa trên giá trị trung bình và biến đổi của gradient; sau đó, những đường biên cục bộ sẽ được chọn từ toàn cục theo những ngưỡng cục bộ. Kết quả của bước này cho ra ảnh gọi là ảnh đã được lọc biên (refined edge image). - Tiến hành làm mảnh và rút ngắn trên ảnh đã được lọc biên. Kết quả cuối cùng được gọi là ảnh được trích rút. Khi người sử dụng nhập vào một bức ảnh phát họa ở dạng thô như là một ảnh truy vấn, nó cũng lần lượt được đưa qua các giai đoạn chuẩn hóa kích thước, nhị phân hóa, làm mảnh hoá và rút gọn. Kết quả của quá trình xử lý này cho ra một ảnh gọi là bản phát họa đều nét. Giờ đây, bản phát họa đều nét phải được so khớp với những ảnh được trích rút ở trên. Thuật giải so khớp là thuật giải dựa vào mối tương quan. Hai ảnh sẽ được chia ra làm những hệ thống lưới ô vuông. Đối với mỗi hệ thống lưới ô vuông của ảnh truy vấn, tương quan cục bộ với hệ thống lưới ô vuông tương ứng của ảnh cơ sở dữ liệu sẽ được tính. Để thiết thực hơn, tương quan cục bộ được tính cho một vài những dịch chuyển khác biệt trong vị trí trong hệ thống ô lưới trên những ảnh cơ sở dữ liệu và giá trị tương quan cực đại qua tất cả những dịch chuyển là kết quả của cho hệ thống ô lưới đó. Độ đo sự giống nhau cuối cùng là tổng của mỗi tương quan cục bộ. Độ đo khoảng cách là nghịch đảo của độ đo sự giống nhau này. Từ những chú giải trên, nó có thể được biểu diển lại dưới dạng sau: 1 dsketch (I,Q) = --------- g maxn [dcorrelation (shift(A1 (g)),LQ (g))]
  • 37. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 24 trong đó AI (g) quy cho hệ thống ô lưới g của ảnh được trích rút được tính từ ảnh cơ sở dữ liệu I, shift(AI (g)) quy cho phiên bản được dịch chuyển của hệ thống lưới g của cùng ảnh được trích rút, và L(g) quy cho hệ thống ô lưới g của bản họa đều nét có kết quả từ ảnh truy vấn Q. 2.3 Các nghiên cứu liên quan 2.3.1 Trong nước Hiện nay ở Việt Nam, nhất là ở thành phố Hồ Chí Minh có ít nhóm nghiên cứu liên quan đến vấn đề truy vấn ảnh. Kết quả thu được còn hạn chế. Các bài báo khoa học trong nước khá khiêm tốn. 2.3.2 Ngoài nước  Hệ thống QBIC (Query By Image Content)  Hệ thống QBIC của hãng IBM là một hệ thống tra cứu ảnh thương mại đầu tiên và nổi tiếng nhất trong số các hệ thống tra cứu ảnh dựa trên nội dung. Nó cho phép người sử dụng tra cứu ảnh dựa vào màu sắc, hình dạng và kết cấu. QBIC cung cấp một số phương pháp: Simple, Multi-feature và Multi-pass. Trong phương pháp truy vấn Simple chỉ sử dụng một đặc điểm. Truy vấn multi-feature bao gồm nhiều đặc điểm và mọi đặc điểm đều có trọng số như nhau trong suốt quá trình tìm kiếm. Truy vấn Multi-pass sử dụng đầu ra của các truy vấn trước làm cơ sở cho bước tiếp theo. Người sử dụng có thể vẽ ra và chỉ định màu, kết cấu mẫu của hình ảnh yêu cầu. Trong hệ thống QBIC màu tương tự được tính toán bằng độ đo bình phương sử dụng biểu đồ k phần tử và màu trung bình được sử dụng như là bộ lộc để cải tiến hiệu quả của truy vấn.  Hệ thống Photobook  Hệ thống này được phát triển ở viện kỹ thuật Massachusetts. Nó cho phép người sử dụng tra cứu ảnh dựa trên màu sắc, hình dạng và kết cấu. Hệ thống này cung cấp một tập các thuật toán đối sánh gồm: Euclidean, mahalanobis, vector space angle, histogram, Fourier peak, và wavelet tree distance như là những độ đo khoảng cách. Hệ thống như là một công cụ bán tự động và có thể sinh ra một mẫu truy vấn dựa vào những ảnh mẫu được cung cấp bởi người sử dụng. Điều này cho
  • 38. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 25 phép người sử dụng trực tiếp đưa những yêu cầu truy vấn của họ với những lĩnh vực khác nhau, và mỗi lĩnh vực họ có thể thu được những mẫu truy vấn tối ưu.  Hệ thống RetrievalWare  Hệ thống này được phát triển bởi tập đoàn công nghệ Excalibur cho phép người sử dụng tra cứu ảnh bởi nội dung màu, hình dạng, kết cấu, độ sáng, kết cấu màu và hệ số co. Người sử dụng có thể điều chỉnh tỷ trọng của những đặc điểm này trong suốt quá trình tìm kiếm.  Hệ thống Imatch  Hệ thống này cho phép người sử dụng tra cứu ảnh bởi nội sung màu, hình dạng và kết cấu. Nó cung cấp một số phương pháp để tra cứu ảnh tương tự: Màu tương tự, màu và hình dạng, màu và hình dạng mờ, phân bố màu. Màu tương tự để tra cứu những ảnh tương tự với ảnh mẫu dựa trên sự phân bố màu toàn cục. Màu và hình dạng thực hiện tra cứu bởi việc kết hợp cả hình dạng, kết cấu và màu. Màu và hình dạng mờ thực hiện thêm những bước xác định đối tượng trong ảnh mẫu. Phân bố màu cho phép người sử dụng vẽ ra sự phân bố màu hoặc xác định tỷ lệ phần trăm của một màu trong hình ảnh mong muốn. Imatch cũng cung cấp những đặc điểm khác nội dung để xác định ảnh: ảnh nhị phân, ảnh định dạng khác và những ảnh có tên tương tự.  Hệ thống VisualSEEK và WebSEEK  Cả hai hệ thống này đều được phát triển tại Trường Đại học Colombia. Visual SEEK là hệ thống cơ sở dữ liệu ảnh. Nó cho phép người sử dụng tra cứu ảnh dựa trên màu sắc, không gian miền và đặc điểm kết cấu. Thêm vào đó Visual SEEK còn cho phép người sử dụng tạo truy vấn bằng việc chỉ định vùng màu và những không gian vị trí của chúng. WebSEEK là một catalog ảnh và là công cụ tìm kiếm trên trang web (website).
  • 39. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 26 CHƯƠNG 3: PHƯƠNG PHÁP ĐỀ XUẤT TÌM KIẾM ẢNH THEO NỘI DUNG 3.1 Yêu cầu bài toán Tìm kiếm ảnh theo nội dung là sử dụng các nội dung của ảnh để miêu tả và truy xuất từ cơ sở dữ liệu lớn. Hệ thống tìm kiếm ảnh theo nội dung (Content Based Image Retrieval - CBIR) điển hình được chia làm hai loại: trích chọn đặc trưng ngoại tuyến và truy xuất ảnh trực tuyến. Hình 3.1, biểu diễn kiến trúc của tìm kiếm ảnh theo nội dung, hệ thống tự động trích xuất thuộc tính thị giác (màu, hình dạng và kết cấu) của mỗi bức ảnh trong cơ sở dữ liệu, được thể hiện bằng các giá trị điểm ảnh và lưu trữ chúng trong một cơ sở dữ khác trong hệ thống gọi là cơ sở dữ liệu véc tơ đặc trưng. Dữ liệu đặc trưng như là chữ ký ảnh hoặc đặc trưng ảnh cho mỗi thuộc tính thị giác của mỗi ảnh là nhỏ hơn nhiều so với kích thước của dữ liệu ảnh. Trong truy xuất ảnh trực tuyến là người sử dụng gửi một hình ảnh truy vấn đến hệ thống tìm kiếm ảnh theo nội dung để tìm ảnh mong muốn. Hệ thống sẽ biểu diễn ảnh truy vấn này với một véc tơ đặc trưng. Độ đo tương đồng giữa các véc tơ đặc trưng trong ảnh mẫu của các ảnh trong cơ sở dự liệu đặc trưng được tính và xếp hạng. Sự truy xuất được tính bằng sơ đồ lập chỉ mục để cung cấp một phương pháp tìm kiếm hiệu quả trong cơ sở dữ liệu ảnh. Cuối cùng, hệ thống xếp hạng sẽ trả về kết quả các bức ảnh gần giống nhất so với ảnh truy vấn. Image Feature Image Features Retrieved Feature Query Feature Hình 3.1: Cấu trúc của hệ thống CBIR
  • 40. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 27 Cấu trúc của hệ thống CBIR đề xuất được thể hiện trong Hình 3.1. Đối với các cơ sở dữ liệu ảnh đã cho, các đặc trưng trích xuất đầu tiên từ các hình ảnh riêng biệt. Các đặc trưng có tính trực quan như màu sắc, kết cấu, hình dạng, vùng miền, đặc trưng không gian hoặc một số đặc trưng vùng nén ảnh. Đặc trưng sau khi trích xuất được mô tả bởi các véc tơ đặc trưng. Những véc tơ đặc trưng này sau đó được lưu trữ để tạo thành cơ sở dữ liệu đặc trưng hình ảnh. Đối với ảnh truy vấn nhất định, trích xuất đặc trưng của nó thể hiện bằng véc tơ đặc trưng. Véc tơ đặc trưng này được đối sánh với các véc tơ đã được lưu trữ trong cơ sở dữ liệu đặc trưng ảnh. Đôi khi kỹ thuật thu giảm số chiều được sử dụng để giảm các tính toán. Khoảng cách giữa các véc tơ đặc trưng của ảnh truy vấn với những ảnh trong cơ sở dữ liệu ảnh được tính toán. Khoảng cách của ảnh truy vấn với chính nó là số không nếu cùng trong cơ sở dữ liệu. Khoảng cách này sau đó được lưu trữ theo thứ tự tăng dần và được truy xuất với sự giúp đỡ của sơ đồ lập chỉ mục. Kỹ thuật trích xuất đặc trưng ảnh hưởng đến tốc độ truy xuất của hệ thống CBIR. Một véc tơ đặc trưng là một tập hợp các thông số mô tả một ảnh. Đa số các véc tơ được biểu diễn bởi một đặc trưng ảnh, chẳng hạn như màu sắc, kết cấu, hoặc hình dạng của đối tượng. Các véc tơ đặc trưng được tạo ra bởi các giải thuật giống nhau từ không gian véc tơ đặc trưng. Văn bản chú thích cho ảnh mô tả như lớp đặc trưng cấp cao. Các đặc trưng như màu sắc và kết cấu, hình dạng được gọi là đặc trưng cấp thấp. Những vấn đề quan trọng của hệ thống đề xuất tìm kiếm hình ảnh dựa trên nội dung: - Lựa chọn các cơ sở dữ liệu hình ảnh. - Độ đo tương đồng. - Đánh giá hiệu suất quá trình truy xuất. - Trích xuất đặc trưng hình ảnh cấp thấp. Đánh giá về hiệu suất truy xuất là một vấn đề rất quan trọng trong hệ thống tìm kiếm ảnh theo nội dung (CBIR). Nhiều phương pháp khác nhau để đo lường hiệu quả hoạt động của một hệ thống đã được đưa ra và được sử dụng bởi các nhà
  • 41. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 28 nghiên cứu. Các biện pháp đánh giá phổ biến nhất được sử dụng trong CBIR là độ chính xác (Precision rate) và độ phủ (Recall rate) được định nghĩa như sau: Số ảnh tìm được đúng Độ chính xác = Số ảnh tìm được Độ phủ = Số ảnh tìm được đúng Tổng số ảnh đúng thực có trong CSDL 3.2. Mô hình nghiên cứu 3.2.1. Mô hình phối hợp các đặc trưng ảnh Trong mô hình này, có thể sử dụng một hoặc nhiều đặc trưng ảnh được trích dựa trên biến đổi wavelets kết hợp với các đặc trưng ảnh khác. Để đơn giản giả sử dùng 3 véc tơ đặc trưng ảnh là FW1 , FW2 (các đặc trưng trích dựa trên wavelets) và Forther (là đặc trưng ảnh khác, ví dụ: đặc trưng màu) trích từ ảnh truy vấn; và tương ứng , , được trích từ ảnh thứ j trong cơ sở dữ liệu. Mô hình này có thể được mở rộng cho nhiều(hoặc ít) hơn các đặc trưng trích dựa trên wavelets và các đặc trưng khác. Bước đầu tiên của mô hình là ánh xạ các véc tơ đặc trưng đến kết quả đo đạc sự tương tự giữa hai véc tơ của hai ảnh. Cụ thể: - Dw1 : N w1 , với Nw1 là số chiều của véc tơ đặc trưng F w1 , theo phép đo: Dw1 (F w1 , F j w1 ). - Dw2 : N w2 , với Nw2 là số chiều của véc tơ đặc trưng F w2 , theo phép đo: Dw2 (F w2 , F j w2 ). - Dother : N other , với Nother là số chiều của véc tơ đặc trưng F other , theo phép đo: Dother (F other , F j other ). Các phép đo Dw1 , Dw2 , Dother có thể là một trong các phép đo sự tương tự trình bày trong Mục 2.3. Bước tiếp theo của mô hình thực hiện ánh xạ Dmatching : 3 3 , bởi:
  • 42. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 29 Dmatching (Fw1, Fw2, Fotherw1, F jw1, F jw2, F jotherw1) = Matching{.Dw1 (F w1 , F j w1 ). Dw2 (F w2 , F j w2 ). Dother (F other , F j otherw1 )} với α, β, γ là các giá trị trọng số. Matching là hàm xác định từ thực nghiệm. Từ kết quả tính toán Dmatching của ảnh truy vấn và các ảnh j trong cơ sở dữ liệu, căn cứ trên sắp xếp theo thứ tự từ nhỏ đến lớn của các giá trị để đưa ra các ảnh kết quả tương tự nhất với ảnh truy vấn. 3.2.2 Kết hợp toán tử LTP (Local Ternary Pattern) Mẫu nhị phân cục bộ (LBP – Local Binary Pattern) là một bộ mã có 2 giá trị (nhị phân) được sử dụng thành công trong nhiều ứng dụng. Ý tưởng toán tử LBP được dựa trên hai giá trị là bit 1 hoặc bit 0. Điều này không cho phép toán tử LBP phân biệt giữa nhiều mẫu. Toán tử LBP có hai hạn chế là: - Toán tử LBP không thể phân biệt giữa hai giá trị pixel nếu một trong những điểm ảnh đầu tiên gần các điểm ảnh trung tâm, nhưng một chút sau đó điểm ảnh và một trong những không thể phân biệt thứ hai là thấp hơn nhiều so với giá trị trung tâm điểm ảnh. - Trong hình ảnh khu vực bằng phẳng, chẳng hạn như trong hình ảnh khuôn mặt, nơi mà tất cả các điểm ảnh gần như có cùng giá trị màu xám, nếu một số lượng nhỏ của tiếng ồn được thêm vào những khu vực khai thác LBP sẽ cung cấp cho một số bit giá trị 0 và khác giá trị 1. Vì vậy, tính năng LBP sẽ không ổn định và do đó toán tử LBP sẽ không thích hợp cho việc phân tích các khu vực này. Để giải quyết những vấn đề này một toán tử kết cấu 3 giá trị mới (Mẫu tam phân cục bộ - LTP), có thể được coi như là một phần mở rộng cho LBP được giới thiệu gần đây. Thay vì một ngưỡng mà chỉ dựa trên các giá trị điểm ảnh trung tâm của miền lân cận, người sử dụng sẽ xác định một ngưỡng t và giá trị điểm ảnh bất kỳ trong khoảng thời gian -t và t +, do đó gán giá trị 0 cho điểm ảnh đó, trong khi người dùng gán giá trị 1 cho điểm ảnh đó nếu nó là ở trên ngưỡng này và một giá trị -1 nếu nó là dưới nó khi so sánh với các giá trị điểm ảnh trung tâm. Phương trình sau đây cho thấy làm thế nào để tính toán toán tử LTP.
  • 43. tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 Nhận viết đề tài trọn gói – ZL: 0909 23 26 20– Luanvantot.com TẢI TÀI LIỆU KẾT BẠN ZALO : 0909 23 26 20 30 1 if  pc t  pi pc (1) LPT (i )0 if  if  pi pct 1 Trong đó t là ngưỡng do người sử dụng quy định, pi là một giá trị điểm ảnh trong miền lân cận và pc là giá trị điểm ảnh trung tâm. Định nghĩa này dẫn đến việc có được một toán tử kết cấu ít nhạy cảm với tiếng ồn (vì nó không còn chủ yếu dựa trên giá trị của điểm ảnh trung ương) nhưng không còn chặt chẽ bất biến thành màu xám cấp phép biến đổi. Hình sau cho thấy một ví dụ về toán tử LTP hoạt động bằng cách sử dụng một giá trị ngưỡng t = 5: Để thoát khỏi những giá trị âm trong hình trên, các giá trị LTP được chia thành hai kênh LBP, phía trên LTP (LTP) và thấp hơn LTP (LTPL) như trong hình bên dưới. LTPU thu được bằng cách thay thế các giá trị tiêu cực trong LTP gốc bằng số không. Các LTPL thu được trong hai bước: đầu tiên, thay thế tất cả các giá trị của 1 trong việc LTP ban đầu là số không sau đó thay đổi các giá trị âm là 1.