Hướng dẫn mysql match against

Trong bài học này mình sẽ giới thiệu thuật ngữ Natural Language Full-Text Searches, bằng cách sử dụng hai hàm MATCH() and AGAINST() trong MySQL.

Hướng dẫn mysql match against
Hướng dẫn mysql match against

Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Trong kỹ thuật
tìm kiếm Full Text Search, MySQL tìm kiếm các hàng hoặc tài liệu có liên quan đến truy vấn ngôn ngữ tự nhiên của văn bản một cách tự do. MySQL tính toán mức độ liên quan dựa trên các yếu tố khác nhau bao gồm số lượng từ trong tài liệu, số lượng từ duy nhất trong tài liệu, tổng số từ trong collection và số lượng tài liệu (hàng) có chứa một từ cụ thể.

Để thực hiện tìm kiếm toàn văn bản bằng tìm kiếm tự nhiên ta sử dụng các hàm MATCH()AGAINST(). Hàm MATCH () chỉ định cột nơi bạn muốn tìm
kiếm và hàm AGAINST() xác định biểu thức tìm kiếm sẽ được sử dụng.

1. Cách sử dụng hàm MATCH () và AGAINST ()

Trước khi bắt đầu thì ta hãy tạo một table có cấu trúc như sau:

Bài viết này được đăng tại [free tuts .net]

Hướng dẫn mysql match against

Sau đó mình tạo Index Full Text Search cho cột productLine.

ALTER TABLE products 
ADD FULLTEXT(productline);

Tiếp theo, để truy vấn tìm kiếm cho cột này bằng kỹ thuật Full
Text Search thì ta sử dụng hai hàm trên như sau:

SELECT 
    productName, 
    productLine 
FROM products 
WHERE 
    MATCH(productLine) 
    AGAINST('Classic');

Kết quả trả về là những record mà cột productLine có xuất hiện từ Classic.

Hướng dẫn mysql match against

Để tìm theo hai từ Classic hoặc Vintage thì ta sẽ ngăn cách nó bằng dấu phẩy.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productline) 
    AGAINST('Classic,Vintage')
ORDER BY productName;

Kết quả:

Hướng dẫn mysql match against

Hàm AGAINST() theo mặc định sẽ nằm ở chế độ IN NATURAL LANGUAGE MODE, đầy là các chế độ mà ta sẽ được học ở bài tiếp theo.

Xem thêm:  Trần kiều ân đông phương bất bại

Bạn có thể xác định chế độ này một cách tường minh bằng cách thêm từ khóa IN NATURAL LANGUAGE MODE vào tham số thứ hai của hàm.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productline) 
	AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE)

Theo mặc định, MySQL thực hiện tìm kiếm theo kiểu không phân biệt chữ hoa chữ thường. Tuy nhiên
bạn có thể sử dụng tìm kiếm kiểu binary collation cho cột index thì sẽ phân biệt được.

2. Sắp xếp kết quả trả về dựa vào mức độ liên quan

Một tính năng rất quan trọng trong việc xử lý tìm kiếm đó là sắp xếp kết quả trả về theo thứ tự: tài liệu nào giống nhiều nhất thì nằm trên cùng, giống ít nhất thì nằm dưới cùng.

Khi bạn sử dụng hàm MATCH() ở lệnh WHERE thì MySQL sẽ trả về giá trị có mức độ liên quan lên đầu tiên.

Hãy xem ví dụ dưới đây để hiểu rõ hơn. Mình đã tạo
một Index Full Text Search cho field productName.

ALTER TABLE products 
ADD FULLTEXT(productName);

Tiếp theo mình muốn truy vấn tìm kiếm trên field này, bằng hai từ khóa Ford hoặc 1932 hoặc có cả hai.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productName) 
    AGAINST('1932,Ford');

Kết quả xuât hiện như sau:

Hướng dẫn mysql match against

Những
kết quả xuất hiện cả hai từ cùng lúc sẽ được ưu tiên đặt trên cùng, tiếp theo là những record chỉ xuất hiện 1 từ.

Tóm lai, bạn cần lưu ý những vấn đề sau khi làm việc với full text search trong MySQL:

  • Độ dài tối thiểu cho từ cần tìm là 4. Ví dụ bạn tìm từ “và” hoặc “tôi” thì mặc định MySQL sẽ xác định đó là những từ vô nghĩa. Vì trong tiếng Anh những từ có 3 chữ cái đều là vô nghĩa. Tuy nhiên bạn có thể mở file /etc/mysql/my.cnf và tìm đến dòng ft_min_word_len = 3 chỉnh lại số mong muốn.
  • Có một
    số từ Stop Words sẽ bị bỏ qua nằm trong file storage/myisam/ft_static.c. Bạn muốn thay đổi thì hãy vào file đó nhé.
Xem thêm:  Kinh nghiệm tập xe đạp cho be

Như vậy là mình đã hướng dẫn xong cách sử dụng hai hàm MATCH và AGAINST để truy vấn Full Text Search trong MySQL. Chúc các bạn thực hiện thành công, hẹn gặp lại ở bài tiếp theo.

Thuộc website harveymomstudy.com

Related Posts