Các phương pháp tìm kiếm thông tin hiện đại. Phương pháp quy nạp thông tin. Quá trình nhận thức với việc sử dụng quy nạp được thực hiện từ những phán đoán và sự kiện đơn lẻ đến những quy luật và khái quát chung, trong đó khuôn mẫu chung được thể hiện. Tìm kiếm

Video hướng dẫn: Cách tạo truy vấn trong Microsoft Access trong 10 phút

Bài học: Sử dụng các công cụ của công cụ tìm kiếm (tạo truy vấn)

Các chức năng quan trọng nhất khi làm việc với cơ sở dữ liệu là bộ lọc thông tin, tìm kiếm và truy vấn.


Sắp xếp là quá trình sắp xếp thứ tự thông tin theo một số thuộc tính. Có các loại tăng dần và giảm dần. Nếu cơ sở dữ liệu có thông tin số, thì xếp hạng được sử dụng như là sắp xếp và nếu đó là thông tin dạng văn bản, thì sắp xếp theo thứ tự bảng chữ cái được sử dụng.


Khi xem xét sắp xếp theo hệ thống quản lý cơ sở dữ liệu trong MS Access, việc sắp xếp được thực hiện trong một trường duy nhất. Nếu một sắp xếp mới được sử dụng, thì các kết quả trước đó của nó sẽ bị mất. Nếu sắp xếp được lồng vào nhau, thì nó có thể được thực hiện bằng cách sử dụng một truy vấn.


Lọc là sự lựa chọn thông tin theo yêu cầu của người dùng. Bạn có thể đặt các điều kiện lựa chọn phức tạp.

Để tìm một số dữ liệu, bạn có thể sử dụng các ký tự đặc biệt được gọi là mặt nạ:


* - nghĩa là có thể chọn bất kỳ số ký tự nào.

? - thay vì ký tự này, có thể có bất kỳ ký tự nào được phép sử dụng.

# - bất kỳ số nào có thể được sử dụng thay thế cho ký tự này.

- bất kỳ ký tự nào trong ngoặc.

- - bất kỳ ký tự nào tương ứng với phạm vi đã chọn.

! - bất kỳ ký tự nào, ngoại trừ những ký tự được đặt trong dấu ngoặc vuông.

Bộ lọc theo dấu hiệu này có thể được sử dụng cho toàn bộ bảng hoặc cho một phần dữ liệu đã được chọn theo một số tiêu chí.

Yêu cầu- chức năng này có quy mô lớn và có thể bao gồm cả phân loại và lọc. Tính năng này cho phép bạn chọn dữ liệu trong nhiều trường và bảng. Bạn có thể tạo một thư viện truy vấn được lưu để sử dụng trong tương lai. Có một ngôn ngữ truy vấn SQL đặc biệt - có cấu trúc.


Sau khi nghiên cứu chủ đề này, bạn sẽ học và lặp lại:

Máy chủ tìm kiếm để làm gì?
- bổ nhiệm các bộ phận chính của máy chủ tìm kiếm;
- những loại tìm kiếm thông tin nào tồn tại trên Internet;
- các quy tắc cơ bản để tạo yêu cầu trong công cụ tìm kiếm Yandex.

Tìm kiếm theo URL

Cách nhanh nhất và đáng tin cậy nhất để tìm kiếm thông tin trên Internet là tìm kiếm các URL. Nhiều người trong số họ được phát hành trong các ấn phẩm in, sách tham khảo đặc biệt, được nghe trên sóng của các đài phát thanh nổi tiếng và từ màn hình TV.

♦ Người hâm mộ câu lạc bộ bóng đá Zenit thuộc lòng địa chỉ www.fc-zenit.ru.
♦ Các fan của nhóm "Korol i Shut" đều biết rõ về trang web chính thức của nhóm này là www.korol.spb.ru.
♦ Người hâm mộ kênh NTV có thể dễ dàng tìm thấy trang web của kênh tại www.ntv.ru. Để truy cập nhanh vào các tài nguyên trên, chỉ cần khởi chạy một chương trình trình duyệt, chẳng hạn như Internet Explorer và nhập một URL quen thuộc vào thanh địa chỉ.

Công cụ tìm kiếm

Có một lượng lớn tài liệu trên Internet. Để tạo điều kiện thuận lợi cho việc tìm kiếm thông tin cần thiết, các công cụ tìm kiếm đặc biệt được tạo ra.

công cụ tìm kiếm- Đây là các hệ thống tự động thăm dò các máy chủ được kết nối với mạng toàn cầu và lưu trữ thông tin về dữ liệu có sẵn trên các máy chủ trong cơ sở dữ liệu của chúng. Theo một yêu cầu được xây dựng đặc biệt, các công cụ tìm kiếm cung cấp thông tin về nơi bạn có thể lấy dữ liệu cần thiết.

Theo quy luật, công cụ tìm kiếm bao gồm ba phần: rô bốt, lập chỉ mục và chương trình xử lý yêu cầu.

Robot (Nhện, Robot hoặc Bot) là một chương trình truy cập các trang web và đọc (toàn bộ hoặc một phần) nội dung của chúng. Các rô bốt của công cụ tìm kiếm khác nhau về sơ đồ riêng để phân tích nội dung của một trang web.
Chỉ mục công cụ tìm kiếm- đây là kho lưu trữ hình ảnh tìm kiếm được truy cập bởi các trang rô bốt. Hình ảnh tìm kiếm của tài liệu (bao gồm cả trang web) là mô tả nội dung của tài liệu bằng ngôn ngữ truy xuất thông tin đặc biệt. Mô tả này chứa các mã cho các từ khóa của tài liệu, phản ánh ý nghĩa và nội dung của nó. Các chỉ mục trong mỗi công cụ tìm kiếm khác nhau về số lượng và cách thức lưu trữ thông tin. Cơ sở dữ liệu của các công cụ tìm kiếm hàng đầu lưu trữ thông tin về hàng chục triệu tài liệu và khối lượng chỉ mục của chúng là hàng trăm gigabyte. Các chỉ mục được cập nhật và bổ sung định kỳ, do đó, kết quả của công việc của một công cụ tìm kiếm với cùng một truy vấn có thể khác nhau nếu tìm kiếm được thực hiện vào những thời điểm khác nhau.

Yêu cầu xử lý là một chương trình, theo yêu cầu của người dùng, "tìm kiếm" chỉ mục về sự hiện diện của thông tin cần thiết và trả về các liên kết đến các tài liệu được tìm thấy. Tập hợp các liên kết ở đầu ra của hệ thống được chương trình phân phối theo thứ tự phù hợp giảm dần y, nghĩa là từ mức độ phù hợp cao nhất với yêu cầu đến mức thấp nhất.

Hiện tại, phổ biến nhất đối với người dùng Internet Nga là ba công cụ tìm kiếm loại chỉ mục chính:

Các hệ thống này có tính đến các đặc điểm ngữ pháp của tiếng Nga, vì vậy kết quả tìm kiếm của họ trong các nguồn thông tin bằng tiếng Nga có chất lượng cao hơn so với các hệ thống của phương Tây.

Các công cụ tìm kiếm khác nhau về mức độ bao phủ của các nguồn thông tin:

♦ Các công cụ tìm kiếm nói chung có một cơ sở dữ liệu về tất cả các lĩnh vực kiến ​​thức và được phân biệt bởi một chỉ mục mở rộng và một lượng lớn thông tin tích lũy;
♦ Các công cụ tìm kiếm có mục đích đặc biệt chỉ tìm kiếm các trang web có chủ đề cụ thể, chẳng hạn như các trang web về âm nhạc hoặc bảo tàng.

Các đặc điểm chính của công cụ tìm kiếm là:

♦ khối lượng tài liệu trong mục lục;
♦ tần suất cập nhật thông tin;
♦ không gian thông tin mà rô bốt công cụ tìm kiếm bao phủ và sự đa dạng của các loại tài liệu về thông tin được thu thập;
♦ yêu cầu tốc độ xử lý;
♦ tiêu chí để xác định mức độ liên quan (sự tương ứng của tài liệu được tìm thấy với truy vấn tìm kiếm);
♦ khả năng chi tiết hóa và làm rõ yêu cầu.

Tìm kiếm bằng phiếu đánh giá của công cụ tìm kiếm

Thư mục tìm kiếm là một tập hợp (chọn lọc) có hệ thống các liên kết đến các tài nguyên Internet khác. Các liên kết được tổ chức dưới dạng một công cụ đánh giá chuyên đề, là một cấu trúc phân cấp, di chuyển theo đó bạn có thể tìm thấy thông tin mình cần.

Hãy để chúng tôi làm ví dụ về cấu trúc của danh mục Internet tìm kiếm Yandex. Đây là một thư mục có mục đích chung, vì nó chứa các liên kết đến các tài nguyên Internet theo hầu hết các hướng có thể. Danh mục này bao gồm các chủ đề sau:

♦ Kinh doanh và kinh tế;
♦ Tài liệu tham khảo và liên kết;
♦ Xã hội và chính trị;
♦ Nhà và gia đình;
♦ Khoa học và giáo dục;
♦ Giải trí và nghỉ dưỡng;
♦ Máy tính và thông tin liên lạc;
♦ Văn hóa nghệ thuật.

Mỗi chủ đề bao gồm nhiều tiểu mục và những tiểu mục này lần lượt chứa các điểm đánh giá, v.v.

Giả sử bạn đang chuẩn bị một sự kiện cho Ngày Chiến thắng và muốn tìm kiếm trên Internet những lời trong bài hát quân sự nổi tiếng của Bulat Okudzhava "You hear the boots ầm ầm". Việc tìm kiếm có thể được tổ chức như sau: Danh mục Yandex Văn hóa và nghệ thuật Âm nhạc Bài hát của tác giả.

Phương pháp tìm kiếm này khá nhanh và hiệu quả. Cuối cùng, bạn chỉ được cung cấp 5 liên kết, trong số đó có các liên kết đến các trang web có các bài hát của những người nổi tiếng. Nó vẫn chỉ để tìm thấy trên trang web một kho lưu trữ với lời bài hát của B. Okudzhava và chọn văn bản mong muốn trong đó.

Một vi dụ khac. Giả sử bạn định mua một chiếc điện thoại di động và muốn so sánh các đặc điểm của các thiết bị từ các công ty khác nhau. Việc tìm kiếm có thể được tiến hành theo các tiêu đề danh mục sau: Danh mục Yandex Máy tính và thông tin liên lạc Truyền thông di động Điện thoại di động.

Sau khi nhận được một số tài liệu tham khảo hạn chế, bạn có thể nhanh chóng xem chúng và chọn một chiếc điện thoại bằng cách xem xét các đặc điểm của các hãng và các sửa đổi của thiết bị.

Tìm kiếm từ khóa

Hầu hết các công cụ tìm kiếm đều có khả năng tìm kiếm theo từ khóa. Đây là một trong những kiểu tìm kiếm phổ biến nhất. Để tìm kiếm theo từ khóa, hãy nhập từ hoặc một số từ cần tìm trong một cửa sổ đặc biệt và nhấp vào nút Tìm kiếm. Công cụ tìm kiếm sẽ tìm thấy trong cơ sở dữ liệu của nó và hiển thị các tài liệu có chứa những từ này. Có thể có nhiều tài liệu như vậy, nhưng rất nhiều trong trường hợp này không nhất thiết có nghĩa là tốt.

Hãy tiến hành một số thử nghiệm với bất kỳ công cụ tìm kiếm nào. Giả sử chúng tôi quyết định bắt đầu một bể cá và chúng tôi quan tâm đến bất kỳ thông tin nào về chủ đề này.

Thoạt nhìn, điều đơn giản nhất là tìm kiếm từ "bể cá". Ví dụ: hãy kiểm tra điều này trong công cụ tìm kiếm Yandex. Kết quả tìm kiếm sẽ có hơn 460.000 trang trên 3.500 trang web - một số lượng lớn các liên kết. Hơn nữa, nếu bạn quan sát kỹ hơn, trong số đó sẽ có các trang web đề cập đến nhóm Thủy cung của B. Grebenshchikov, các trung tâm mua sắm và các hiệp hội không chính thức có cùng tên, và nhiều hơn nữa không liên quan đến cá cảnh.

Dễ dàng đoán rằng một tìm kiếm như vậy không thể làm hài lòng ngay cả những người dùng khiêm tốn. Sẽ phải dành quá nhiều thời gian để lựa chọn trong số tất cả các tài liệu được đề xuất có liên quan đến chủ đề chúng ta cần, và thậm chí nhiều hơn nữa để tìm hiểu nội dung của chúng.

Bạn có thể kết luận ngay rằng thông thường không nên tìm kiếm theo một từ, vì rất khó xác định chủ đề của một tài liệu, trang web hoặc trang web bằng một từ. Ngoại lệ là những từ hiếm và thuật ngữ hầu như không bao giờ được sử dụng bên ngoài chủ đề của chúng.

Hãy thử làm rõ các điều kiện tìm kiếm và nhập cụm từ "cá cảnh". Kết quả tìm kiếm sẽ có hơn 20.000 trang và khoảng 650 trang. Như bạn thấy, số lượng liên kết đã giảm hơn 20 lần. Kết quả này phù hợp với chúng tôi hơn, nhưng tất cả đều giống nhau, trong số các liên kết được đề xuất mà bạn có thể gặp, ví dụ, bộ lưu niệm của Nga gồm nhãn phù hợp với hình ảnh cá và bộ sưu tập bảo vệ màn hình máy tính để bàn và danh mục cá cảnh có ảnh và bể cá các cửa hàng phụ kiện.

Rõ ràng là chúng ta nên tiếp tục đi theo hướng tinh chỉnh các điều kiện tìm kiếm.

Để làm cho việc tìm kiếm hiệu quả hơn, tất cả các công cụ tìm kiếm đều có một ngôn ngữ truy vấn đặc biệt với cú pháp riêng của nó. Các ngôn ngữ này tương tự nhau về nhiều mặt. Học tất cả chúng khá khó, nhưng bất kỳ công cụ tìm kiếm nào cũng có hệ thống trợ giúp cho phép bạn thành thạo ngôn ngữ mong muốn.

Dưới đây là mười quy tắc đơn giản để tạo một yêu cầu trong công cụ tìm kiếm Yandex.

1. Từ khóa trong truy vấn phải được viết bằng chữ thường (nhỏ). Điều này sẽ đảm bảo rằng tất cả các từ khóa đều được tìm kiếm, không chỉ những từ khóa bắt đầu bằng chữ hoa.

2. Việc tìm kiếm có tính đến tất cả các dạng của từ theo các quy tắc của tiếng Nga, bất kể dạng của từ trong truy vấn. Ví dụ: nếu từ “biết” được chỉ định trong truy vấn, thì các từ “biết”, “biết”, v.v. cũng sẽ đáp ứng điều kiện tìm kiếm.

3. Để tìm kiếm một cụm từ ổn định, bạn nên đặt các từ trong dấu ngoặc kép, ví dụ: “bát đĩa sứ”.

4. Để tìm kiếm theo dạng từ chính xác, bạn phải đặt dấu chấm than trước từ đó. Ví dụ: để tìm kiếm từ "Tháng 9" trong trường hợp thông minh, bạn sẽ viết "! Tháng 9".

5. Để tìm kiếm trong một câu, các từ trong truy vấn được phân tách bằng dấu cách hoặc dấu &: "tiểu thuyết phiêu lưu" hoặc "phiêu lưu & tiểu thuyết". Một số từ được nhập trong truy vấn, được phân tách bằng dấu cách, có nghĩa là tất cả chúng phải được đưa vào một câu của tài liệu đang được tìm kiếm.

6. Nếu bạn chỉ muốn chọn những tài liệu trong đó xuất hiện mọi từ được chỉ định trong truy vấn, hãy đặt dấu cộng "+" trước mỗi từ đó. Ngược lại, nếu bạn muốn loại trừ bất kỳ từ nào khỏi kết quả tìm kiếm, hãy đặt dấu trừ "-" trước từ này. Các dấu "+" và "-" phải được viết với khoảng trắng từ dấu trước và được ghép với từ tiếp theo. Ví dụ: truy vấn "Volga-car" sẽ tìm các tài liệu có chứa từ "Volga" chứ không phải từ "car".

7. Khi tìm kiếm từ đồng nghĩa hoặc từ gần nghĩa, bạn có thể đặt một thanh dọc "|" giữa các từ. Ví dụ, đối với truy vấn "con | đứa trẻ | baby "sẽ tìm tài liệu có bất kỳ từ nào trong số này.

8. Thay vì một từ trong một truy vấn, bạn có thể thay thế toàn bộ một biểu thức. Để làm điều này, nó phải được đặt trong dấu ngoặc vuông, ví dụ "(child | baby | children | baby) + (care | upbringing)".

9. Ký tự * ~ "(dấu ngã) cho phép bạn tìm tài liệu có câu chứa từ đầu tiên, nhưng không chứa từ thứ hai. Ví dụ, tìm kiếm "books ~ shop" sẽ tìm thấy tất cả các tài liệu có chứa từ "books" mà không có từ "shop" bên cạnh nó (trong câu).

10. Nếu toán tử được lặp lại một lần (ví dụ, & hoặc ~), thì việc tìm kiếm sẽ được thực hiện trong câu. Toán tử kép (&&, -) tìm kiếm trong tài liệu. Ví dụ, truy vấn "ung thư - chiêm tinh học" sẽ tìm thấy các tài liệu có từ "ung thư" không liên quan đến chiêm tinh học.

Bạn có thể sử dụng tìm kiếm nâng cao để có một tập hợp các thuật ngữ phổ biến nhất trong khu vực mong muốn. Trên hình. 3.3 hiển thị cửa sổ tìm kiếm nâng cao trong công cụ tìm kiếm Yandex. Trong chế độ này, các khả năng của ngôn ngữ truy vấn được triển khai dưới dạng biểu mẫu. Một dịch vụ tương tự, bao gồm bộ lọc từ điển, được cung cấp bởi hầu hết các công cụ tìm kiếm.

Cơm. 3.3. Ví dụ về tìm kiếm nâng cao trong hệ thống Yandex

Với sự lựa chọn chính xác các từ mong muốn và bắt buộc cũng như loại trừ các cụm từ không mong muốn, việc tìm kiếm như vậy có thể cho kết quả tốt.

Hãy quay lại với ví dụ về cá cảnh. Sau khi đọc một số tài liệu được cung cấp bởi công cụ tìm kiếm, rõ ràng là việc tìm kiếm thông tin trên Internet không nên bắt đầu bằng việc lựa chọn cá cảnh. Bể cá là một hệ thống sinh học phức tạp, việc tạo ra và duy trì chúng đòi hỏi kiến ​​thức đặc biệt, thời gian và sự đầu tư nghiêm túc.

Dựa trên thông tin nhận được, một người thực hiện tìm kiếm trên Internet có thể thay đổi hoàn toàn chiến lược tìm kiếm thêm, quyết định nghiên cứu tài liệu đặc biệt liên quan đến vấn đề đang nghiên cứu.

Để tìm kiếm tài liệu văn học hoặc tài liệu toàn văn, có thể thực hiện truy vấn sau:

"+ (bể thủy sinh | người chơi thủy sinh | người chơi thủy sinh) + cho người mới bắt đầu + (lời khuyên | tài liệu) + (bài báo | luận án | toàn văn) - (giá cả | cửa hàng | giao hàng | danh mục)".

Sau khi xử lý yêu cầu của công cụ tìm kiếm, kết quả sau thu được: trang - 195, trang - ít nhất 43.

Có thể thấy qua thống kê tìm kiếm, kết quả rất thành công. Các liên kết đầu tiên đã dẫn đến các tài liệu được yêu cầu:

Thiết lập hồ cá> Mẹo cho người mới bắt đầu chơi thủy sinh>
Các bài báo> Aq uascope. en
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - tuân thủ nghiêm ngặt.
TƯ VẤN ĐỂ BẮT ĐẦU THỦY SẢN. Làm thế nào để chọn và lắp đặt một bể cá, làm thế nào để ...
http://www.aquariums.ru/sovna.htm (2KB) 23/07/2002 - thư từ không nghiêm ngặt.

Giờ đây, bạn có thể tóm tắt kết quả tìm kiếm, rút ​​ra một số kết luận nhất định và quyết định các hành động có thể thực hiện:

♦ Hãy dừng việc tìm kiếm thêm, vì nhiều lý do khác nhau, việc bảo trì bể cá nằm ngoài khả năng của bạn.
♦ Đọc các bài báo gợi ý và bắt đầu thiết lập một bể cá.
♦ Tìm kiếm tài liệu về chuột đồng hoặc chuột đồng.

Tìm kiếm Chuyên nghiệp

Các nhà nghiên cứu và chuyên gia sẽ phải có cách tiếp cận chu đáo hơn đối với việc tổ chức tìm kiếm. Khi tìm kiếm thông tin trên Internet một cách chuyên nghiệp, các yêu cầu sau phải được đáp ứng:

♦ tốc độ tìm kiếm cao;
♦ độ tin cậy của thông tin nhận được;
♦ tính đầy đủ của phạm vi bảo hiểm của các nguồn lực trong quá trình tìm kiếm.

Tốc độ. Tốc độ tìm kiếm chủ yếu phụ thuộc vào hai yếu tố: vào việc lập kế hoạch tìm kiếm có năng lực (lựa chọn dịch vụ và công cụ tìm kiếm) và kỹ năng làm việc với tài nguyên đã được chọn (khả năng hiểu nhanh cấu trúc và phương pháp điều hướng của nó). Các chỉ mục tìm kiếm không đủ để đảm bảo tốc độ tìm kiếm. Ngoài chúng, có một số tài nguyên tìm kiếm trên Internet, việc sử dụng chúng đảm bảo hiệu suất của một tìm kiếm chuyên nghiệp.

Độ tin cậy. Câu hỏi về độ tin cậy của thông tin nhận được từ Internet là rất phù hợp, vì bất kỳ ai cũng có thể đặt bất kỳ thông tin nào ở đó mà không có bất kỳ sự kiểm soát nào đối với việc tuân thủ thực tế của nó. Điều này dẫn đến một số lượng lớn các nguồn không đáng tin cậy, chẳng hạn như tóm tắt và các bài báo học kỳ đã tràn ngập Internet.

Có các dịch vụ tìm kiếm đặc biệt cho phép bạn đánh giá độ tin cậy của một nguồn thông tin trên Internet.

Tính hoàn chỉnh. Điều kiện cần thiết để thu thập thông tin quy mô đầy đủ thành công là kiến ​​thức về các loại tài nguyên chính tồn tại ngày nay và việc sử dụng các dịch vụ tìm kiếm khác nhau. Không có công cụ tìm kiếm nào có thể bao quát tất cả các tài nguyên của Internet.

Như một quy luật, để đạt được một kết quả tích cực, người dùng phải sử dụng các dịch vụ của một số công cụ tìm kiếm. Bạn có thể tự làm việc đó, chuyển từ hệ thống này sang hệ thống khác hoặc bạn có thể giao công việc này cho một trong các công cụ metasearch (meta là thành phần đầu tiên của các từ ghép biểu thị các hệ thống để mô tả và nghiên cứu các hệ thống khác).

Cơm. 3.4. Cửa sổ Metasearch

Công cụ Metasearch không có cơ sở dữ liệu tìm kiếm của riêng mình và sử dụng tài nguyên của nhiều công cụ tìm kiếm khác khi tìm kiếm. Do đó, xác suất tìm thấy thông tin cần thiết là rất cao. Công việc trong hệ thống metasearch được thực hiện theo các quy tắc tương tự như công việc trong các công cụ tìm kiếm. Điều này là do các công cụ metasearch là một loại tiện ích bổ sung cho các công cụ tìm kiếm và sử dụng cơ sở dữ liệu chỉ mục của chúng trong công việc. Sự xuất hiện của các công cụ metasearch giống với sự xuất hiện của các công cụ tìm kiếm nổi tiếng. Trên hình. 3.4 hiển thị các cửa sổ của công cụ metasearch myweb.ru và metabot.ru.

Kinh nghiệm cho thấy rằng trong hầu hết các trường hợp, kết quả tốt hơn đạt được khi sử dụng một số chỉ mục tìm kiếm độc lập hơn là sử dụng một công cụ metasearch.

Kiểm soát câu hỏi và nhiệm vụ

1. Mục đích của một chương trình trình duyệt là gì?

2. Bạn biết chương trình trình duyệt nào?

3. Người dùng lập kế hoạch tìm kiếm trên Internet có thể tìm thấy URL ở đâu?

4. Công nghệ tìm kiếm cho điểm đánh giá của công cụ tìm kiếm là gì?

5. Công nghệ tìm kiếm từ khóa là gì?

6. Những yêu cầu nào phải được tuân thủ trong việc tìm kiếm thông tin trên Internet một cách chuyên nghiệp?

7. Khi nào bạn cần chỉ định các dấu "+" hoặc "-" trong tiêu chí tìm kiếm?

8. Tiêu chí tìm kiếm nào trong Yandex được đặt bởi cụm từ sau:

(vú em | giáo viên | gia sư) ++ (chăm sóc | nuôi dạy | giám sát).

9. Nhân đôi dấu (∼∼ hoặc ++) có nghĩa là gì khi tạo một truy vấn phức tạp?

10. Mức độ liên quan của tìm kiếm là gì?

11. Mục đích của động cơ metasearch là gì?

Phân loại công cụ tìm kiếm (loại và kiểu của chúng) Các công cụ tìm kiếm có thể được chia thành: - thư mục hoặc thư mục - thư mục - công cụ tìm kiếm - công cụ tìm kiếm. Việc phân loại này dựa trên nguyên tắc lựa chọn và xử lý thông tin cho cơ sở dữ liệu công cụ tìm kiếm, cụ thể là: quá trình này tự động như thế nào, ai tạo ra cơ sở dữ liệu công cụ tìm kiếm: con người hay máy tính.


Phân loại công cụ tìm kiếm (loại và kiểu của chúng) Gần đây, sự khác biệt giữa công cụ tìm kiếm và thư mục đã bị "xóa", vì người tạo ra chúng đang cố gắng không tập trung người dùng vào các nguyên tắc lựa chọn thông tin, nhưng đưa ra càng nhiều cơ hội dịch vụ tương tự càng tốt , hoạt động như cổng thông tin chung. Nhưng sự khác biệt trong việc lựa chọn và xử lý thông tin vẫn rất cần thiết và mang tính quyết định: - các công cụ tìm kiếm sử dụng rô bốt để tìm kiếm, lập chỉ mục thông tin - tức là Quá trình này hoàn toàn tự động; - các thư mục được xây dựng dựa trên thực tế là trang web đang "chờ đợi" để được chấp nhận, xử lý và mô tả bởi một chuyên gia biên mục nhất định.


Phân loại các công cụ tìm kiếm (loại và kiểu của chúng) Các nguyên tắc hoạt động khác nhau như vậy của các công cụ tìm kiếm và thư mục ảnh hưởng đáng kể đến khối lượng và nội dung của chúng, và do đó, chiến lược tìm kiếm: toàn văn của nó. Các thư mục đại diện cho trang web này hoặc trang web đó theo các thuật ngữ chung - người biên mục chú thích và hệ thống hóa trang web phù hợp với nội dung chung của nó và toàn bộ văn bản không được lập chỉ mục. Các công cụ tìm kiếm lập chỉ mục một số lượng lớn các trang web, bởi vì các robot "duyệt" nội dung của Web hoạt động theo nguyên tắc "quả cầu tuyết", di chuyển từ liên kết này sang liên kết khác. Mặt khác, các thư mục được phân biệt bởi ý nghĩa và tính trật tự của việc lựa chọn các vị trí trong cơ sở dữ liệu của chúng (thường là những vị trí có nhiều thông tin và / hoặc các đối tượng vật lý lớn).


Phân loại các công cụ tìm kiếm (loại và loại của chúng) Vì vậy, một số công cụ tìm kiếm: Altavista (Yandex (Google (Rambler (FastSearch (


Phân loại các công cụ tìm kiếm (loại và kiểu của chúng) Và các thư mục (hoặc thư mục): Yahoo (Librarian Index to the Internet (lii.org) List.ru (


Phân loại các công cụ tìm kiếm (các loại và kiểu của chúng) Trong số các công cụ được liệt kê, như bạn đã nhận thấy, có cả các công cụ tìm kiếm toàn cầu phổ quát và các công cụ khu vực phổ quát (trong trường hợp này là các công cụ của Nga). Đây là một số người khác: EuroFerret (Voila (Altavista France (fr.altavista.com) UKPlus (ukplus.co.uk))


Phân loại công cụ tìm kiếm (loại và kiểu của chúng) Việc phân chia công cụ tìm kiếm thành toàn cầu và khu vực không gì khác hơn là phân loại theo nguyên tắc địa lý để lựa chọn tài nguyên để lập chỉ mục. Các công cụ tìm kiếm khác cũng hạn chế cơ sở dữ liệu của họ về mặt nội dung, nhưng theo chủ đề: FindLaw (Whowhere (Tìm kiếm âm nhạc (Tìm kiếm hài hước (FindBook (


Phân loại công cụ tìm kiếm (loại và loại của chúng) Lưu ý rằng các công cụ tìm kiếm chuyên biệt hoặc chuyên đề như vậy có thể sử dụng: cơ sở dữ liệu của riêng chúng để tìm kiếm truy vấn của bạn hoặc chúng tìm kiếm trên toàn bộ trang Web bằng các công cụ tìm kiếm khác.


Phân loại các công cụ tìm kiếm (loại và kiểu của chúng) Ngoài ra, có các công cụ metasearch cung cấp khả năng tìm kiếm trong một số công cụ tìm kiếm cùng một lúc. Ví dụ: Mamma (Ưu điểm là trong trường hợp này số lượng kết quả trả về tối đa, nhược điểm là không phải tất cả các công cụ tìm kiếm đều có cú pháp ngôn ngữ truy vấn giống nhau (ví dụ, dấu ngoặc kép không được hỗ trợ bởi mọi công cụ tìm kiếm).


Các yếu tố chính của ngôn ngữ truy vấn công cụ tìm kiếm Hãy liệt kê các yếu tố và đặc điểm chung của ngôn ngữ truy vấn công cụ tìm kiếm: Hầu hết sử dụng: + hoặc - (bao gồm hoặc loại trừ cụm từ khỏi đơn thuốc tìm kiếm); "ngoặc kép" (để chỉ định một cụm từ, một cụm từ ổn định). Một số sử dụng kết hợp AND, AND NOT thay cho dấu + hoặc -.


Các yếu tố cơ bản của ngôn ngữ truy vấn công cụ tìm kiếm Hầu hết đều cho phép các ký tự cắt bớt từ ở bên trái * (ví dụ: wish * - sẽ được tìm thấy: wish, wish, wishful, wishbone, và Wishy-washy) Một số công cụ tìm kiếm nhạy cảm với các chữ cái viết hoa và viết thường (ví dụ: nếu bạn tìm kiếm tài liệu về những người có họ Stone bằng cách sử dụng Altavista, hãy chắc chắn sử dụng chữ cái viết hoa, vì nếu không, tất cả các trang web có từ stone sẽ được tìm thấy).


Các phần tử chính của ngôn ngữ truy vấn công cụ tìm kiếm (sử dụng Yandex làm ví dụ) Phần tử Nghĩa là gì Không gian truy vấn mẫu hoặc & hoặc + logic AND (trong một câu) luật gia đình && logic AND (trong tài liệu) công thức nấu ăn && (pho mát nấu chảy) | ORphoto logic | nhiếp ảnh | ảnh chụp nhanh | hình ảnh


Các thành phần chính của ngôn ngữ truy vấn công cụ tìm kiếm (sử dụng Yandex làm ví dụ) () nhóm từ (công nghệ | sản xuất) (bơ | phô mai tươi) ~ hoặc - union AND NOT (trong câu) think ~ law ~ ~ union AND NOT (trong tài liệu) hướng dẫn ở paris ~~ (agency | tour) "" tìm kiếm cụm từ "tuyển tập thơ"


Các yếu tố chính của ngôn ngữ truy vấn công cụ tìm kiếm (trên ví dụ về Yandex)! trước từ, dạng chính xác của từ! real! moment - Luật này có hiệu lực sau hai tuần kể từ khi được công bố. $ title ("") Biểu thức có trong trường Tiêu đề của tài liệu HTML. $ title ("thực vật và động vật") - các trang có tiêu đề tương tự như "Hệ thực vật và động vật ở Siberia"


Và, kết luận: 1) Để xây dựng chính xác chiến lược tìm kiếm, trước tiên bạn phải tự quyết định loại thông tin bạn muốn nhận - một số thông tin chung mô tả tổng thể một đối tượng hoặc hiện tượng hoặc một số chi tiết, cụ thể có thể xuất hiện trong toàn văn của một tài liệu. Trong trường hợp đầu tiên, bạn nên sử dụng một thư mục, trong trường hợp thứ hai - một công cụ tìm kiếm. 2) Nếu khi bắt đầu tìm kiếm, bạn vẫn không biết chính xác bạn muốn nhận được bao nhiêu và cái gì trong kết quả truy vấn, bạn nên sử dụng kết hợp các công cụ tìm kiếm khác nhau.

công cụ tìm kiếm

Công cụ tìm kiếm là phần mềm đặc biệt, mục đích chính là cung cấp khả năng tìm kiếm thông tin chất lượng cao và tối ưu nhất cho người sử dụng Internet. Các công cụ tìm kiếm được lưu trữ trên các máy chủ web đặc biệt, mỗi máy chủ thực hiện một chức năng cụ thể:

1. Phân tích các trang web và nhập kết quả phân tích ở cấp độ này hoặc cấp độ khác của cơ sở dữ liệu của máy chủ tìm kiếm.

2. Tìm kiếm thông tin theo yêu cầu của người dùng.

3. Cung cấp giao diện thân thiện với người dùng để người dùng tìm kiếm thông tin và xem kết quả tìm kiếm.

Các phương pháp làm việc được sử dụng khi làm việc với các công cụ tìm kiếm này hoặc các công cụ tìm kiếm khác gần như giống nhau. Trước khi tiếp tục thảo luận về chúng, hãy xem xét các khái niệm sau:

1. Giao diện công cụ tìm kiếm được trình bày dưới dạng một trang với các siêu liên kết, một chuỗi truy vấn (chuỗi tìm kiếm) và các công cụ kích hoạt truy vấn.

2. Chỉ mục của công cụ tìm kiếm là cơ sở thông tin chứa kết quả phân tích các trang web, được biên soạn theo những quy tắc nhất định.

3. Truy vấn là một từ khóa hoặc cụm từ mà người dùng nhập vào thanh tìm kiếm. Các ký tự đặc biệt ("", ~), các ký hiệu toán học (*, +,?) Được sử dụng để tạo thành các truy vấn khác nhau.

Sơ đồ tìm kiếm thông tin rất đơn giản. Người dùng nhập một cụm từ khóa và kích hoạt tìm kiếm, do đó nhận được lựa chọn tài liệu theo yêu cầu đã lập (cho sẵn). Danh sách tài liệu này được xếp hạng theo các tiêu chí nhất định để ở đầu danh sách là những tài liệu phù hợp nhất với truy vấn của người dùng. Mỗi công cụ tìm kiếm sử dụng các tiêu chí khác nhau để xếp hạng tài liệu, cả trong phân tích kết quả tìm kiếm và hình thành chỉ mục (điền vào cơ sở dữ liệu chỉ mục của các trang web).

Do đó, nếu bạn chỉ định một truy vấn có cùng thiết kế trong chuỗi tìm kiếm cho mỗi công cụ tìm kiếm, bạn có thể nhận được các kết quả tìm kiếm khác nhau. Đối với người dùng, điều quan trọng là tài liệu nào sẽ xuất hiện trong hai hoặc ba tá tài liệu đầu tiên theo kết quả tìm kiếm và những tài liệu này tương ứng với mong đợi của người dùng ở mức độ nào.

Hầu hết các công cụ tìm kiếm cung cấp hai cách để tìm kiếm - tìm kiếm đơn giản(tìm kiếm đơn giản) và tìm kiếm nâng cao(tìm kiếm nâng cao) có và không có biểu mẫu yêu cầu đặc biệt. Hãy xem xét cả hai loại tìm kiếm trên ví dụ về công cụ tìm kiếm bằng tiếng Anh.

Ví dụ: AltaVista hữu ích cho các truy vấn tùy ý, "Đôi điều về bằng cấp trực tuyến trong công nghệ thông tin", trong khi công cụ tìm kiếm Yahoo cho phép bạn nhận tin tức thế giới, thông tin tỷ giá hối đoái hoặc dự báo thời tiết.

Nắm vững các tiêu chí để tinh chỉnh truy vấn và các kỹ thuật tìm kiếm nâng cao cho phép bạn tăng hiệu quả tìm kiếm và nhanh chóng tìm thấy thông tin cần thiết. Trước hết, bạn có thể tăng hiệu quả tìm kiếm bằng cách sử dụng các toán tử logic (phép toán) Hoặc, Và, Gần, Không, các ký hiệu toán học và đặc biệt trong các truy vấn. Với sự trợ giúp của toán tử và / hoặc ký hiệu, người dùng liên kết các từ khóa theo trình tự mong muốn để có được kết quả tìm kiếm thích hợp nhất cho truy vấn. Các biểu mẫu yêu cầu được thể hiện trong Bảng 1.

Bảng 1

Một truy vấn đơn giản cung cấp một số liên kết đến tài liệu, bởi vì danh sách bao gồm các tài liệu có chứa một trong các từ được nhập theo yêu cầu hoặc một cụm từ đơn giản (xem bảng 1). Toán tử and cho phép bạn chỉ định rằng tất cả các từ khóa nên được đưa vào nội dung tài liệu. Tuy nhiên, số lượng tài liệu có thể vẫn còn nhiều và có thể mất nhiều thời gian để xem xét chúng. Do đó, trong một số trường hợp, việc sử dụng toán tử ngữ cảnh gần sẽ thuận tiện hơn nhiều, điều này chỉ ra rằng các từ phải được đặt trong tài liệu ở khoảng cách vừa đủ. Sử dụng gần làm giảm đáng kể số lượng tài liệu được tìm thấy. Sự hiện diện của ký hiệu "*" trong chuỗi truy vấn có nghĩa là từ đó sẽ được tìm kiếm bằng mặt nạ của nó. Ví dụ, chúng ta hãy lấy một danh sách các tài liệu có chứa các từ bắt đầu bằng "gov" nếu chúng ta viết "gov *" trong chuỗi truy vấn. Đây có thể là những từ chính phủ, thống đốc, v.v.

Dịch vụ tìm kiếm thông tin bằng tiếng Nga phát triển nhất được cung cấp bởi máy chủ tìm kiếm Yandex. Trong Yandex, bạn có thể chỉ cần viết bằng tiếng Nga một cụm từ mô tả những gì bạn muốn tìm và hệ thống sẽ phân tích và xử lý yêu cầu của bạn, sau đó cố gắng tìm mọi thứ liên quan đến một chủ đề nhất định. Bạn có thể, bằng cách sử dụng các toán tử đặc biệt, soạn một chuỗi giải thích cho công cụ tìm kiếm những yêu cầu của bạn đối với thông tin bạn quan tâm.

Công cụ tìm kiếm phổ biến không kém Rambler duy trì thống kê về lưu lượng liên kết từ cơ sở dữ liệu của riêng nó, cùng các toán tử logic VÀ, HOẶC, KHÔNG, ký tự siêu * (tương tự như ký tự * trong AltaVista mở rộng phạm vi truy vấn), ký hiệu hệ số + và - là được hỗ trợ để tăng hoặc giảm các từ quan trọng được nhập vào truy vấn.

Chúng ta hãy xem xét các công nghệ tìm kiếm thông tin phổ biến nhất trên Internet.

Bài giảng 4. Các công cụ truy xuất thông tin

Việc cập nhật liên tục mảng thông tin, kết hợp với sự gia tăng khối lượng dữ liệu, khiến việc xem xét các tài liệu sẵn có trở nên vô cùng khó khăn và do đó, việc tìm kiếm, có thể được chia theo điều kiện thành:

  • tìm kiếm thực tế:trong bách khoa toàn thư, sách tham khảo, từ điển,
  • tìm kiếm thư mục:thư viện, thư mục, chương trình.
  • tìm kiếm tài liệu:tài liệu điện tử, thư viện điện tử, tạp chí điện tử.

Tầm quan trọng của vấn đề truy xuất thông tin đã dẫn đến sự hình thành của cả một ngành công nghiệp với nhiệm vụ chính xác là hỗ trợ người dùng điều hướng trong không gian mạng. Làm cho ngành này trở nên đặc biệtdịch vụ tìm kiếm hoặc các dịch vụ. Theo truyền thống, chúng được chia thành:

  • thư mục hoặc danh mục
  • công cụ tìm kiếm

Những giống này trông rất giống nhau về mặt hình ảnh, bởi vì"mỗi thư mục có công cụ tìm kiếm riêng và mỗi công cụ tìm kiếm có thư mục riêng". Tuy nhiên, các nguyên tắc làm việc của họ dựa trên các cách tiếp cận và công nghệ hoàn toàn khác nhau. Ngoài ra, mỗi loại dịch vụ tìm kiếm được sử dụng để giải quyết một loại vấn đề nhất định. Việc truy xuất thông tin liên quan đến việc sử dụng các chiến lược, phương pháp, cơ chế và công cụ nhất định. Hành vi của người dùng quản lý quá trình tìm kiếm không chỉ được xác định bởi nhu cầu thông tin, mà còn bởi tính đa dạng của công cụ của hệ thống - các công nghệ và công cụ được cung cấp bởi hệ thống. Việc lựa chọn công cụ quyết định phần lớnchiến lược tìm kiếm và các công nghệ tìm kiếm.

Công nghệ tìm kiếm- trình tự thống nhất (được tối ưu hóa trong một hệ thống truy xuất thông tin cụ thể) để sử dụng hiệu quả các công cụ tìm kiếm riêng lẻ trong quá trình người dùng tương tác với hệ thống.

Công nghệ tìm kiếm được sử dụngHệ thống thông tin có thể được chia thành 3 loại:

  • danh mục chuyên đề và danh mục chuyên ngành (thư mục trực tuyến);
  • công cụ tìm kiếm (tìm kiếm toàn văn);
  • công cụ tìm kiếm meta.

Danh mục chuyên đềcung cấp cho việc xử lý các tài liệu và phân công chúng vào một trong một số danh mục, danh sách trong số đó đã được xác định trước. Trên thực tế, điều này quen thuộc với tất cả các thủ thư.lập chỉ mục dựa trên phân loại. Danh mục chuyên ngành hoặc hướng dẫn được tạo trên các nhánh và chủ đề riêng biệt.công cụ tìm kiếm(phương tiện tìm kiếm tiên tiến nhất trên Internet) thực hiện công nghệ tìm kiếm toàn văn. Các văn bản nằm trên các máy chủ được yêu cầu được lập chỉ mục.Khi sử dụng tiền metasearch Yêu cầu được thực hiện đồng thời bởi một số công cụ tìm kiếm. Kết quả tìm kiếm được kết hợp thành một tổng thể, sắp xếp theo mức độ liên quan, danh sách.

Công cụ tìm kiếm - một phức hợp phụ thuộc lẫn nhau của ngôn ngữ truy xuất thông tin và ngôn ngữ định nghĩa / quản lý dữ liệu cung cấp các chuyển đổi cấu trúc và ngữ nghĩa của các đối tượng xử lý (tài liệu, từ điển, bộ sưu tập kết quả tìm kiếm).

1. Sách tham khảo

Các công cụ tìm kiếm của nhóm thứ nhất là các thư mục điện tử có cấu trúc theo chủ đề hoặc hệ thống phân cấp rõ ràng,giống như cấu trúc của một danh mục thư viện có hệ thống. Làm việc với các thư mục cho phép bạn điều hướng các tài nguyên Internet trong các nhánh kiến ​​thức riêng lẻ, đi sâu từ cái chung đến cái riêng, thay đổi các nhánh phân cấp, quay lại một vài bước, v.v.

Trong số những phát triển của Nga trong lĩnh vực này là:

  • Aport (địa chỉ: www.aport.ru),
  • List.ru (địa chỉ: list.mail.ru),
  • Danh sách web (địa chỉ: www.weblist.ru),
  • Ivan Susanin (địa chỉ: www.susanin.net
  • Ốc (địa chỉ: www.ulitka.ru).

Đặc điểm phân biệt chính của sách tham khảo là chúng được làm bằng tay. Ban biên tập của mỗi cuốn sách tham khảovề bản chất công việc, họ giống với bộ phận biên mục và hệ thống hóa của các thư viện lớn, thường xuyên xem xét nội dung của các máy chủ mới xuất hiện và theo dõi các thay đổi trên các máy chủ hiện có. Dữ liệu tiết lộ được phân tích và nhập vào các phần của cuốn sách tham khảo phù hợp với phân loại được chấp nhận. Mô tả toàn bộ máy chủ (hoặc một phần, nếu nó có vẻ là một khối hoàn toàn độc lập) được cung cấp kèm theo chú thích ngắn gọn chứa thông tin chung về bản chất của thông tin có sẵn. Trong một số trường hợp, thông tin bổ sung được nhập về ngôn ngữ của tài liệu, sự tham gia của tài nguyên, vị trí thực của nó, v.v.

Các tham số chính đặc trưng cho lợi thế của thư mục là:

  • âm lượng;
  • hiệu quả của việc phản ánh các nguồn lực mới hoặc thay đổi;
  • tính nhất quán và nhất quán của sơ đồ phân loại theo thứ bậc;
  • cấu trúc giao nhau.

Khối lượng của thư mục xác định mức độ tin cậy của nó hoặc "sức mạnh thông tin ". Trong một số hệ thống, có một cơ chế đặc biệt kiểm tra định kỳ tính khả dụng của trang web và loại trừ nó khỏi danh sách trong trường hợp "vắng bóng" lâu trên Web. Tính logic (khoa học) của sơ đồ phân loại được áp dụng xác định mức độ dễ dàng mà người dùng tìm thấy thông tin cần thiết. Hệ thốngtham khảo chéocho phép bạn xác định thông tin bằng các cách tiếp cận khác nhau (ví dụ: theo lãnh thổ hoặc theo ngành). Trong trường hợp này, sơ đồ phân loại sẽ tự động dẫn người dùng đến đối tượng mong muốn, bất kể đường tìm kiếm nào được chọn.

Khả năng biên dịch một truy vấn cho loại công cụ tìm kiếm này không đóng một vai trò đặc biệt. Các tìm kiếm phức tạp đòi hỏi chi tiết yêu cầu không được thực hiện bằng danh mục.

Thư mục được thiết kế để giải quyếtba loại nhiệm vụ:

  • định hướng trong một nhánh kiến ​​thức không quen thuộc;
  • tìm kiếm các đối tượng lớn, chẳng hạn như máy chủ của các tổ chức hoặc các dự án quan trọng;
  • có được danh sách tài nguyên được tạo sẵn có hình ảnh tìm kiếm bị mờ (thư viện thuộc một loại nhất định, lịch trình vận chuyển hoặc trang web của các đảng phái chính trị, v.v.)

Một ví dụ khác là so sánh thư mục tài nguyên với danh mục có hệ thống của thư viện, trong đó một cuốn sách (trong trường hợp này là toàn bộ trang web) chỉ còn lại mô tả và chú thích.

2. Công cụ tìm kiếm

Công việc của các công cụ tìm kiếm (search engine) dựa trên các nguyên tắc công nghệ hoàn toàn khác nhau. Nhiệm vụ của công cụ tìm kiếm là cung cấp một tìm kiếm thông tin chi tiết, chỉ có thể đạt được thông qua kế toán ( lập chỉ mục ) nội dung của càng nhiều trang web càng tốt. Khác với thư mục, các công cụ tìm kiếm hoạt động theo chế độ tự động và có nguyên tắc hoạt động thống nhất.

Công cụ tìm kiếm bao gồm hai thành phần cơ bản. Thành phần đầu tiên là chương trình robot , có nhiệm vụ di chuyển từ máy chủ này sang máy chủ khác và tìm tài liệu mới (hoặc thay đổi) ở đó, tải chúng về máy tính chính của hệ thống. Robot xem qua nội dung của tài liệu, tìm các liên kết mới, đến cả các tài liệu khác trên máy chủ và các trang bên ngoài. Sau đó, chương trình độc lập đi đến các liên kết được chỉ định, tìm các tài liệu mới, sau đó quá trình này được lặp lại một lần nữa,nhớ lại "phương pháp lăn cầu tuyết" nổi tiếng trong thư mục. Các tài liệu đã xác định được xử lý (lập chỉ mục) bởi thành phần thứ hai của công cụ tìm kiếm. Trong trường hợp này, theo quy định, tất cả nội dung của trang đều được tính đến, bao gồm văn bản, hình minh họa, tệp âm thanh và video. Tất cả các từ trong tài liệu đều được lập chỉ mục, giúp bạn có thể sử dụng các công cụ tìm kiếm để tìm kiếm chi tiết về các chủ đề hẹp nhất. Hình thành tập tin chỉ mục , lưu trữ thông tin về từ khóa nào, bao nhiêu lần, sử dụng trong tài liệu nào và trên máy chủ nào, tạo thành cơ sở dữ liệu mà thủ thư truy cập khi nhập các tổ hợp từ khóa trong chuỗi truy vấn.

Đầu ra của kết quả được thực hiện bằng cách sử dụng một mô-đun đặc biệt tạo raxếp hạng kết quả thông minh . Điều này có tính đến:

  • vị trí của thuật ngữ trong tài liệu (tiêu đề, tiêu đề, nội dung văn bản), tần suất lặp lại của nó,
  • tỷ lệ phần trăm của cụm từ tìm kiếm trên văn bản của trang,
  • số lượng và thẩm quyền của các liên kết bên ngoài đến trang này từ các trang khác.

Đến các thông số cơ bản của công cụ tìm kiếm kể lại:

  • số lượng máy chủ được lập chỉ mục và các tài liệu riêng lẻ (khối lượng tệp chỉ mục);
  • mức độ hiệu quả của việc cập nhật cơ sở dữ liệu bằng cách bao gồm thông tin về vật liệu mới và xóa những vật liệu lỗi thời;
  • khả năng đưa ra một yêu cầu;
  • tính thông minh của hệ thống xếp hạng kết quả tìm kiếm;
  • sự hiện diện của các chức năng dịch vụ bổ sung tạo thuận lợi cho công việc của người dùng.

Khả năng của một công cụ tìm kiếm để diễn đạt một truy vấn càng chính xác càng tốt sẽ quyết định phần lớn đến chất lượng của các kết quả thu được. Mỗi máy có từ vựng riêng, cho phép bạn trình bày chi tiết theo các cách khác nhautìm kiếm thứ tự.

Tất cả các công cụ tìm kiếm đều cómô-đun xếp hạng kết quả tìm kiếm. Nó là thành phần cơ bản thứ hai của tất cả các hệ thống. Danh sách các yếu tố được tính đến khi xác định vị trí của một tài liệu trong danh sách các liên kết rộng bất thường: từ vị trí của từ trên trang đến xếp hạng (thẩm quyền) của các trang liên kết đến tài liệu được tìm thấy.

  • Google (địa chỉ: www.google.com),
  • AlltheWeb (địa chỉ: www.alltheweb.com),
  • Alta Vista (địa chỉ: www.altavista.com).

Các công cụ tìm kiếm tương tự cũng tồn tại ở Nga. Tất cả chúng đều được thiết kế để làm việc với các tài liệu tiếng Nga và có một http://www.metabot.ru).

Kết luận về chủ đề của khối bài giảng

Công cụ tìm kiếm thực hiện lựa chọn các trang từ cơ sở dữ liệu theo yêu cầu, sau đó các trang được sắp xếp theo mức độ phù hợp giảm dần (lưu ý A.A.)

Trong trường hợp này, có một sự tương đồng trực tiếp với các nguyên tắc hoạt động của các danh mục tóm tắt phân tán của thư viện. Cơ hội chính tìm kiếm meta là khả năng gửi các yêu cầu của người dùng đồng thời tới các công cụ tìm kiếm khác nhau - với sự tổng hợp kết quả sau đó. (ghi chú của A.A.)

Khi chuyển sang các thư mục, thủ thư có thể chỉ nhận được thông tin rất chung chung về chủ đề và không bao giờ - dữ liệu chi tiết: từ máy chủ của một tập đoàn lớn chứa hàng nghìn trang, thư mục sẽ chỉ hiển thị tên và một vài dòng chú thích.

Đang tải...
Đứng đầu