الأساليب الحديثة في البحث عن المعلومات. طريقة استقرائية لاسترجاع المعلومات. تتم عملية الإدراك باستخدام الاستقراء من أحكام وحقائق فردية إلى القواعد العامة والتعميمات ، حيث يتم التعبير عن النمط العام. بحث

فيديو تعليمي: كيفية إنشاء استعلامات في Microsoft Access في 10 دقائق

محاضرة: استخدام أدوات محرك البحث (إنشاء استعلام)

أهم الوظائف عند العمل مع قواعد البيانات هي تصفية المعلومات والبحث والاستعلام.


فرزهي عملية طلب المعلومات وفقًا لبعض السمات. هناك أنواع تصاعدي وتنازلي. إذا كانت قاعدة البيانات تحتوي على معلومات رقمية ، فسيتم استخدام الترتيب كفرز ، وإذا كانت معلومات نصية ، فسيتم استخدام الترتيب الأبجدي.


عند التفكير في الفرز حسب أنظمة إدارة قواعد البيانات في MS Access ، يتم الفرز في حقل واحد. إذا تم استخدام فرز جديد ، فسيتم فقد نتائجه السابقة. إذا كان الفرز متداخلًا ، فيمكن إجراؤه باستخدام استعلام.


منقيهو اختيار المعلومات المطلوبة من قبل المستخدم. يمكنك تعيين شروط اختيار معقدة.

للعثور على بعض البيانات ، يمكنك استخدام رموز خاصة تسمى قناع:


* - يعني أنه يمكن تحديد أي عدد من الأحرف.

? - بدلاً من هذه الشخصية ، يمكن أن يكون هناك أي حرف مسموح باستخدامه.

# - يمكن استخدام أي رقم بدلاً من هذه الشخصية.

- أية أحرف بين قوسين.

- - أي حرف يتوافق مع النطاق المحدد.

! - أي حرف ما عدا المحاط بأقواس مربعة.

يمكن استخدام هذا التصفية حسب العلامات للجدول بأكمله ، أو لجزء من البيانات المحددة بالفعل وفقًا لبعض المعايير.

طلب- هذه الوظيفة واسعة النطاق ويمكن أن تشمل كلاً من الفرز والتصفية. تسمح لك هذه الميزة بتحديد البيانات في عدة حقول وجداول. يمكنك إنشاء مكتبة استعلام يتم حفظها لاستخدامها في المستقبل. هناك لغة استعلام SQL خاصة - هيكلية.


بعد دراسة هذا الموضوع ستتعلم وتكرر:

ما هي خوادم البحث عن؟
- تعيين الأجزاء الرئيسية لخوادم البحث ؛
- ما هي أنواع البحث عن المعلومات الموجودة على الإنترنت ؛
- القواعد الأساسية لإنشاء طلب في محرك بحث Yandex.

البحث عن طريق عناوين المواقع

الطريقة الأسرع والأكثر موثوقية للعثور على المعلومات على الإنترنت هي البحث عن عناوين URL. يتم تقديم العديد منها في منشورات مطبوعة وكتب مرجعية خاصة ، ويتم سماعها على الهواء من محطات الإذاعة الشعبية ومن شاشات التلفزيون.

♦ يعرف مشجعو نادي زينيت لكرة القدم العنوان www.fc-zenit.ru عن ظهر قلب.
♦ معجبو مجموعة "Korol i Shut" على دراية جيدة بالموقع الرسمي لهذه المجموعة www.korol.spb.ru.
♦ يمكن لعشاق قناة NTV العثور بسهولة على موقع الويب الخاص بها على www.ntv.ru. للوصول السريع إلى الموارد المذكورة أعلاه ، ما عليك سوى تشغيل برنامج متصفح ، مثل Internet Explorer ، واكتب عنوان URL مألوفًا في شريط العناوين.

محركات البحث

يوجد عدد هائل من المستندات على الإنترنت. لتسهيل البحث عن المعلومات الضرورية ، يتم إنشاء محركات بحث خاصة.

محركات البحث- هذه أنظمة آلية تستطلع الخوادم المتصلة بالشبكة العالمية وتخزن معلومات حول البيانات المتاحة على الخوادم في قاعدة بياناتها. وفقًا لطلب تمت صياغته بشكل خاص ، توفر محركات البحث معلومات حول مكان الحصول على البيانات اللازمة.

كقاعدة عامة ، تتكون محركات البحث من ثلاثة أجزاء: برنامج معالجة الروبوت والفهرسة وطلب.

روبوت (عنكبوت ، روبوت ، روبوت)هو برنامج يزور صفحات الويب ويقرأ محتواها (كليًا أو جزئيًا). تختلف روبوتات محركات البحث في مخططها الفردي لتحليل محتوى صفحة الويب.
فهرس محرك البحث- هذا مستودع لصور البحث التي تمت زيارتها بواسطة صفحات الروبوت. صورة البحث عن مستند (بما في ذلك صفحة الويب) هي وصف لمحتوى المستند بلغة خاصة لاسترجاع المعلومات. يحتوي هذا الوصف على أكواد للكلمات الأساسية للوثيقة تعكس معناها ومحتواها. تختلف الفهارس في كل محرك بحث في مقدار وطريقة تخزين المعلومات. تخزن قواعد البيانات الخاصة بمحركات البحث الرائدة معلومات حول عشرات الملايين من المستندات ، وتبلغ أحجام الفهرس الخاصة بها مئات الجيجابايت. يتم تحديث الفهارس واستكمالها بشكل دوري ، لذلك قد تختلف نتائج عمل محرك بحث واحد له نفس الاستعلام إذا تم إجراء البحث في أوقات مختلفة.

معالج الطلبهو برنامج ، بناءً على طلب المستخدم ، "يبحث" في الفهرس عن وجود المعلومات الضرورية ويعيد روابط للمستندات التي تم العثور عليها. يتم توزيع مجموعة الروابط في مخرجات النظام بواسطة البرنامج بترتيب تنازلي من حيث الصلة بالموضوع y ، أي من أعلى درجة لمطابقة الارتباط بالطلب إلى أدنى مستوى.

حاليًا ، الأكثر شيوعًا لمستخدمي الإنترنت الروس هي ثلاثة محركات بحث رئيسية من نوع الفهرس:

تأخذ هذه الأنظمة في الاعتبار السمات النحوية للغة الروسية ، وبالتالي فإن نتائج البحث في موارد اللغة الروسية ذات جودة أعلى من الأنظمة الغربية.

تختلف محركات البحث في تغطية مصادر المعلومات:

♦ تمتلك محركات البحث العامة قاعدة بيانات في جميع مجالات المعرفة وتتميز بفهرس واسع وكمية كبيرة من المعلومات المتراكمة ؛
♦ تبحث محركات البحث ذات الأغراض الخاصة فقط عن المواقع ذات الموضوعات المحددة ، مثل مواقع الموسيقى أو المتاحف.

الخصائص الرئيسية لمحركات البحث هي:

♦ حجم الوثائق في الفهرس ؛
♦ تكرار تحديث المعلومات ؛
مساحة المعلومات التي يغطيها روبوت محرك البحث وأنواع المستندات المتنوعة التي يتم جمع المعلومات عنها ؛
♦ سرعة معالجة الطلب ؛
♦ معيار لتحديد الصلة (تطابق الوثيقة التي تم العثور عليها مع استعلام البحث) ؛
♦ إمكانية تفصيل وتوضيح الطلب.

البحث عن طريق أداة الدهن لمحرك البحث

أدلة البحث عبارة عن مجموعة منهجية (اختيار) من الروابط لمصادر الإنترنت الأخرى. يتم تنظيم الروابط في شكل أداة تقييم موضوعية ، وهي عبارة عن هيكل هرمي ، يمكنك من خلاله العثور على المعلومات التي تحتاجها.

دعونا نعطي كمثال هيكل كتالوج البحث على الإنترنت في Yandex. هذا دليل للأغراض العامة ، حيث يحتوي على روابط لمصادر الإنترنت في جميع الاتجاهات الممكنة تقريبًا. يحتوي هذا الكتالوج على المواضيع التالية:

♦ الأعمال والاقتصاد.
♦ المراجع والروابط.
المجتمع والسياسة.
المنزل والأسرة.
العلم والتعليم ؛
♦ الترفيه والاستجمام.
♦ أجهزة الكمبيوتر والاتصالات.
♦ الثقافة والفن.

يتضمن كل موضوع العديد من الأقسام الفرعية ، وهذه بدورها تحتوي على نماذج ، وما إلى ذلك.

لنفترض أنك تحضر حدثًا ليوم النصر وتريد البحث في الإنترنت عن كلمات الأغنية العسكرية الشهيرة بولات أوكودزهافا "تسمع قعقعة الأحذية". يمكن تنظيم البحث على النحو التالي: كتالوج ياندكس الثقافة والفن أغنية المؤلف الموسيقى.

طريقة البحث هذه سريعة وفعالة. في النهاية ، يتوفر لك 5 روابط فقط ، من بينها روابط لمواقع تحتوي على أغانٍ لأشخاص مشهورين. يبقى فقط العثور على أرشيف على الموقع يحتوي على كلمات من تأليف B. Okudzhava وتحديد النص المطلوب فيه.

مثال آخر. لنفترض أنك ستشتري هاتفًا محمولاً وتريد مقارنة خصائص الأجهزة من شركات مختلفة. يمكن إجراء البحث تحت عناوين الفهرس التالية: كتالوج Yandex أجهزة الكمبيوتر والاتصالات الهواتف المحمولة الاتصالات المتنقلة.

بعد تلقي عدد محدود من المراجع ، يمكنك عرضها بسرعة واختيار هاتف من خلال فحص الخصائص من قبل الشركات وتعديلات الأجهزة.

بحث بكلمة مفتاحية

معظم محركات البحث لديها القدرة على البحث عن طريق الكلمات الرئيسية. هذا أحد أكثر أنواع البحث شيوعًا. للبحث عن طريق الكلمات الرئيسية ، تحتاج إلى إدخال كلمة أو عدة كلمات للبحث في نافذة خاصة والنقر فوق الزر "بحث". سيجد محرك البحث في قاعدة بياناته ويظهر الوثائق التي تحتوي على هذه الكلمات. قد يكون هناك العديد من هذه الوثائق ، لكن الكثير في هذه الحالة لا يعني بالضرورة أنه جيد.

دعونا نجري بعض التجارب مع أي من محركات البحث. لنفترض أننا قررنا بدء حوض مائي وأننا مهتمون بأي معلومات حول هذا الموضوع.

للوهلة الأولى ، أبسط شيء هو البحث عن كلمة "حوض السمك". دعنا نتحقق من ذلك ، على سبيل المثال ، في محرك بحث Yandex. ستكون نتيجة البحث أكثر من 460.000 صفحة على 3500 موقع - عدد هائل من الروابط. علاوة على ذلك ، إذا نظرت عن كثب ، من بينها المواقع التي تذكر مجموعة أكواريوم B. Grebenshchikov ومراكز التسوق والجمعيات غير الرسمية التي تحمل الاسم نفسه ، وأكثر من ذلك بكثير لا علاقة له بأسماك الزينة.

من السهل تخمين أن مثل هذا البحث لا يمكن أن يرضي حتى المستخدم المتواضع. سيتعين قضاء الكثير من الوقت في الاختيار من بين جميع المستندات المقترحة تلك التي تتعلق بالموضوع الذي نحتاجه ، وحتى أكثر من ذلك في التعرف على محتوياتها.

يمكنك أن تستنتج على الفور أنه لا يُنصح عادةً بالبحث بكلمة واحدة ، لأنه من الصعب جدًا تحديد موضوع مستند أو صفحة ويب أو موقع بكلمة واحدة. الاستثناء هو الكلمات والمصطلحات النادرة التي لا تُستخدم أبدًا خارج نطاق موضوعها.

دعنا نحاول توضيح شروط البحث وإدخال العبارة "أسماك الزينة". ستكون نتيجة البحث ما يزيد قليلاً عن 20000 صفحة وحوالي 650 موقعًا. كما ترى ، فقد انخفض عدد الروابط بأكثر من 20 مرة. هذه النتيجة تناسبنا أكثر ، ولكن على الرغم من ذلك ، من بين الروابط المقترحة ، يمكنك العثور على ، على سبيل المثال ، مجموعات تذكارية روسية من ملصقات مطابقة مع صور للأسماك ، ومجموعات من شاشات توقف سطح المكتب للكمبيوتر ، وكتالوجات لأسماك الزينة بالصور ، وحوض السمك متاجر الملحقات.

من الواضح أننا يجب أن نستمر في التحرك في اتجاه تحسين شروط البحث.

من أجل جعل البحث أكثر إنتاجية ، تحتوي جميع محركات البحث على لغة استعلام خاصة مع تركيبها الخاص. هذه اللغات متشابهة في نواح كثيرة. يعد تعلمها جميعًا أمرًا صعبًا للغاية ، ولكن أي محرك بحث لديه نظام مساعدة يسمح لك بإتقان اللغة المطلوبة.

فيما يلي عشر قواعد بسيطة لإنشاء طلب في محرك بحث Yandex.

1. يجب كتابة الكلمات الرئيسية في الاستعلام بأحرف صغيرة (صغيرة). سيضمن ذلك البحث في جميع الكلمات الرئيسية ، وليس فقط الكلمات التي تبدأ بحرف كبير.

2. يأخذ البحث في الاعتبار جميع أشكال الكلمة وفقًا لقواعد اللغة الروسية ، بغض النظر عن شكل الكلمة في الاستعلام. على سبيل المثال ، إذا تم تحديد كلمة "know" في الاستعلام ، فإن الكلمات "know" و "know" وما إلى ذلك ستلبي أيضًا شرط البحث.

3. للبحث عن عبارة ثابتة ، يجب وضع الكلمات بين علامتي تنصيص ، على سبيل المثال ، "أطباق خزفية".

4. للبحث بالصيغة الصحيحة للكلمة ، يجب أن تضع علامة تعجب قبل الكلمة. على سبيل المثال ، للبحث عن كلمة "سبتمبر" في حالة الجينات ، يمكنك كتابة "! سبتمبر".

5. للبحث في جملة واحدة ، يتم فصل الكلمات في طلب البحث بمسافة أو علامة &: "رواية مغامرة" أو "مغامرة ورواية". العديد من الكلمات المكتوبة في الاستعلام ، مفصولة بمسافات ، تعني أنه يجب تضمينها جميعًا في جملة واحدة من المستند الذي يتم البحث عنه.

6. إذا كنت ترغب في تحديد تلك المستندات التي تظهر فيها كل كلمة محددة في الاستعلام ، فضع علامة الجمع "+" أمام كل منها. إذا كنت تريد ، على العكس من ذلك ، استبعاد أي كلمات من نتيجة البحث ، فضع علامة "-" قبل هذه الكلمة. يجب كتابة العلامتين "+" و "-" بمسافة من السابقة ودمجها مع الكلمة التالية. على سبيل المثال ، سيجد الاستعلام "Volga-car" المستندات التي تحتوي على كلمة "Volga" وليس كلمة "car".

7. عند البحث عن مرادفات أو كلمات قريبة من المعنى ، يمكنك وضع شريط عمودي "|" بين الكلمات. على سبيل المثال ، للاستعلام "child | طفل | baby "سيجد المستندات التي تحتوي على أي من هذه الكلمات.

8. بدلاً من كلمة واحدة في استعلام ، يمكنك استبدال تعبير بأكمله. للقيام بذلك ، يجب أن تؤخذ بين قوسين ، على سبيل المثال "(طفل | رضيع | أطفال | رضيع) + (رعاية | تربية)".

9. يسمح لك الحرف * ~ "(التلدة) بالعثور على مستندات تحتوي على جملة تحتوي على الكلمة الأولى ، ولكنها لا تحتوي على الثانية. على سبيل المثال ، سيجد البحث عن "books ~ shop" جميع المستندات التي تحتوي على كلمة "books" التي لا توجد بجوارها كلمة "shop" (ضمن الجملة).

10. إذا تم تكرار عامل التشغيل مرة واحدة (على سبيل المثال ، & أو ~) ، يتم إجراء البحث داخل الجملة. عامل التشغيل المزدوج (&&، -) يبحث داخل المستند. على سبيل المثال ، سيجد الاستعلام "السرطان - التنجيم" المستندات التي تحتوي على كلمة "سرطان" والتي لا تتعلق بعلم التنجيم.

بوجود مجموعة معينة من المصطلحات الأكثر شيوعًا في المنطقة المطلوبة ، يمكنك استخدام البحث المتقدم. على التين. 3.3 تُظهر نافذة البحث المتقدم في محرك بحث Yandex. في هذا الوضع ، يتم تنفيذ قدرات لغة الاستعلام كنموذج. يتم تقديم خدمة مماثلة ، بما في ذلك عوامل تصفية القاموس ، بواسطة جميع محركات البحث تقريبًا.

أرز. 3.3 مثال على البحث المتقدم في نظام Yandex

بالنظر إلى الاختيار الصحيح للكلمات المرغوبة والمطلوبة واستبعاد المصطلحات غير المرغوب فيها ، يمكن لمثل هذا البحث أن يعطي نتائج جيدة.

دعنا نعود إلى مثال أسماك الزينة. بعد قراءة العديد من المستندات التي يقدمها محرك البحث ، يصبح من الواضح أن البحث عن المعلومات على الإنترنت لا ينبغي أن يبدأ باختيار أسماك الزينة. حوض السمك هو نظام بيولوجي معقد ، يتطلب إنشاءه وصيانته معرفة خاصة ووقتًا واستثمارات جادة.

بناءً على المعلومات الواردة ، يمكن لأي شخص يقوم بإجراء بحث على الإنترنت أن يغير جذريًا استراتيجية البحث الإضافي ، ويقرر دراسة الأدبيات الخاصة المتعلقة بالقضية قيد الدراسة.

للبحث عن الأدب أو الوثائق ذات النص الكامل ، يمكن الاستعلام التالي:

"+ (حوض السمك | aquarist | aquarist) + للمبتدئين + (نصيحة | الأدب) + (مقالة | أطروحة | نص كامل) - (السعر | متجر | تسليم | كتالوج)".

بعد معالجة الطلب بواسطة محرك البحث تم الحصول على النتيجة التالية: صفحات - 195 ، موقع - 43 على الأقل.

كما يتضح من إحصائيات البحث ، كانت النتيجة ناجحة جدًا. بالفعل الروابط الأولى تؤدي إلى المستندات المطلوبة:

إعداد حوض السمك> نصائح لعلماء الأحياء المبتدئين>
مقالات> Aq uascope. en
http://aquascope.ru/modules/wfsection/article.php؟page=l&articleid=49 (32KB) - الامتثال الصارم.
نصيحة للباحثين المبتدئين في الأحياء المائية. كيفية اختيار وتثبيت حوض السمك ، وكيفية ...
http://www.aquariums.ru/sovna.htm (2KB) 07/23/2002 - المراسلات غير الصارمة.

يمكنك الآن تلخيص نتائج البحث واستخلاص استنتاجات معينة واتخاذ قرار بشأن الإجراءات الممكنة:

♦ توقف عن البحث ، لأنه لأسباب مختلفة ، فإن صيانة الحوض تتجاوز طاقتك.
اقرأ المقالات المقترحة وابدأ في إنشاء حوض للماء.
♦ ابحث عن مواد عن الهامستر أو الببغاء.

البحث المهني

سيتعين على الباحثين والمتخصصين اتباع نهج أكثر تفكيرًا في تنظيم البحث. عند البحث بشكل احترافي عن المعلومات على الإنترنت ، يجب استيفاء المتطلبات التالية:

♦ سرعة بحث عالية.
♦ موثوقية المعلومات الواردة ؛
♦ اكتمال تغطية الموارد أثناء البحث.

سرعة. تعتمد سرعة البحث بشكل أساسي على عاملين: على تخطيط البحث المختص (اختيار خدمات وأدوات البحث) ومهارات العمل مع مورد تم اختياره بالفعل (القدرة على فهم هيكله وطرق التنقل بسرعة). فهارس البحث ليست كافية لضمان سرعة البحث. بالإضافة إلى ذلك ، هناك عدد من موارد البحث على الإنترنت ، والتي يضمن استخدامها أداء بحث احترافي.

مصداقية. مسألة موثوقية المعلومات الواردة من الإنترنت وثيقة الصلة بالموضوع ، حيث يمكن لأي شخص وضع أي معلومات هناك دون أي سيطرة على امتثالها للواقع. وهذا بدوره يؤدي إلى عدد كبير من المصادر غير الموثوقة ، مثل الملخصات وأوراق المصطلحات التي غمرت الإنترنت.

هناك خدمات بحث خاصة تسمح لك بتقييم موثوقية مصدر المعلومات على الإنترنت.

الاكتمال. من الشروط الضرورية لنجاح جمع المعلومات على نطاق واسع معرفة الأنواع الرئيسية من الموارد الموجودة اليوم واستخدام خدمات البحث المختلفة. لا يوجد محرك بحث يمكنه تغطية جميع موارد الإنترنت.

كقاعدة عامة ، لتحقيق نتيجة إيجابية ، يجب على المستخدم اللجوء إلى خدمات العديد من محركات البحث. يمكنك القيام بذلك بنفسك ، والانتقال من نظام إلى نظام ، أو يمكنك تكليف هذا العمل بأحد محركات البحث الوصفي (الميتا هي المكون الأول للكلمات المركبة التي تشير إلى أنظمة لوصف الأنظمة الأخرى والبحث فيها).

أرز. 3.4. نوافذ Metasearch

لا تمتلك محركات البحث Metasearch قواعد بيانات البحث الخاصة بها وتستخدم موارد العديد من محركات البحث الأخرى عند البحث. نتيجة لهذا ، فإن احتمال العثور على المعلومات الضرورية مرتفع للغاية. يتم العمل في أنظمة البحث الوصفي وفقًا لنفس قواعد العمل في محركات البحث. هذا يرجع إلى حقيقة أن محركات البحث metasearch هي نوع من الوظائف الإضافية لمحركات البحث وتستخدم قواعد بيانات الفهرس الخاصة بهم في عملهم. يشبه مظهر محركات البحث metasearch مظهر محركات البحث المعروفة. على التين. يوضح الشكل 3.4 نوافذ محركات البحث metasearch myweb.ru و metabot.ru.

تظهر التجربة أنه في معظم الحالات يتم تحقيق نتيجة أفضل باستخدام عدة فهارس بحث مستقلة بدلاً من استخدام محرك بحث ميتا واحد.

أسئلة التحكم والمهام

1. ما هو الغرض من برنامج المتصفح؟

2. ما هي برامج المتصفح التي تعرفها؟

3. أين يمكن لمستخدم يخطط لبحث على الإنترنت أن يجد عناوين URL؟

4. ما هي تقنية البحث الخاصة بمؤشر محرك البحث؟

5. ما هي تقنية البحث بالكلمة المفتاحية؟

6. ما هي المتطلبات التي يجب مراعاتها في البحث المهني عن المعلومات على الإنترنت؟

7. متى تحتاج إلى تحديد علامتي "+" أو "-" في معايير البحث؟

8. ما هي معايير البحث في Yandex التي تحددها العبارة التالية:

(مربية | مدرس | مربية) ++ (رعاية | تربية | إشراف).

9. ماذا تعني مضاعفة العلامة (أو ++) عند تكوين استعلام معقد؟

10. ما هي صلة البحث؟

11. ما هو الغرض من محركات البحث metasearch؟

تصنيف أدوات البحث (أنواعها وأنواعها) يمكن تقسيم أدوات البحث إلى: - أدلة أو أدلة - أدلة - محركات بحث - محركات بحث. يعتمد هذا التصنيف على مبدأ اختيار ومعالجة المعلومات لقاعدة بيانات أداة البحث ، أي: مدى أتمتة هذه العملية ، من ينشئ قاعدة بيانات أداة البحث: الأشخاص أو أجهزة الكمبيوتر.


تصنيف أدوات البحث (أنواعها وأنواعها) في الآونة الأخيرة ، تم "محو" الاختلاف بين محركات البحث والأدلة ، حيث يحاول منشئوها عدم تركيز المستخدمين على مبادئ اختيار المعلومات ، ولكن يقدمون أكبر عدد ممكن من فرص الخدمة المماثلة تعمل كبوابات عالمية. لكن الاختلاف في اختيار المعلومات ومعالجتها لا يزال أساسياً وحاسماً: - تستخدم محركات البحث الروبوتات للبحث عن المعلومات وفهرستها - أي العملية مؤتمتة بالكامل ؛ - الدلائل مبنية على حقيقة أن الموقع "ينتظر" قبوله ومعالجته ووصفه من قبل متخصص معين في الفهرسة.


تصنيف أدوات البحث (أنواعها وأنواعها) تؤثر هذه المبادئ المختلفة لتشغيل محركات البحث والأدلة بشكل كبير على حجمها ومحتواها ، وبالتالي على استراتيجية البحث: نصها الكامل. تمثل الدلائل هذا الموقع أو ذاك بعبارات عامة - يقوم المفهرس بتعليق وتنظيم الموقع وفقًا لمحتواه العام ولا تتم فهرسة النصوص الكاملة. تقوم محركات البحث بفهرسة عدد كبير من المواقع ، لأن الروبوتات التي "تتصفح" محتويات الويب تعمل على مبدأ "كرة الثلج" ، وتنتقل من رابط إلى رابط. من ناحية أخرى ، تتميز الدلائل بمغزى وتنظيم اختيار المواقع في قواعد بياناتها (عادة ما تكون غنية بالمعلومات و / أو مواقع لأشياء مادية كبيرة).


تصنيف أدوات البحث (أنواعها وأنواعها) لذا فإن بعض محركات البحث: Altavista (Yandex (Google (Rambler (FastSearch (


تصنيف أدوات البحث (أنواعها وأنواعها) والأدلة (أو الدلائل): Yahoo (فهرس المكتبيين للإنترنت (lii.org) List.ru (


تصنيف أدوات البحث (أنواعها وأنواعها) من بين الأدوات المدرجة ، كما لاحظت ، هناك أدوات بحث عالمية عالمية وأدوات إقليمية عالمية (في هذه الحالة ، أدوات روسية). وهنا بعض الآخرين: EuroFerret (Voila (Altavista France (fr.altavista.com) UKPlus (ukplus.co.uk)


تصنيف أدوات البحث (أنواعها وأنواعها) إن تقسيم أدوات البحث إلى أدوات عالمية وإقليمية ليس أكثر من تصنيف حسب المبدأ الجغرافي لاختيار المصادر للفهرسة. تقيد أدوات البحث الأخرى أيضًا قواعد بياناتها من حيث المحتوى ، ولكن حسب الموضوع: FindLaw (Whowhere (MusicSearch (HumorSearch (FindBook (


تصنيف محركات البحث (أنواعها وأنواعها) لاحظ أن محركات البحث المتخصصة أو المواضيعية يمكن أن تستخدم: إما قواعد بياناتها الخاصة للبحث عن استعلامك ، أو أنها تبحث في الويب بالكامل باستخدام محركات بحث أخرى.


تصنيف أدوات البحث (أنواعها وأنواعها) بالإضافة إلى ذلك ، هناك محركات بحث ميتا التي تعرض البحث في عدة محركات بحث في نفس الوقت. على سبيل المثال: Mamma (الميزة هي أنه في هذه الحالة يتم إرجاع الحد الأقصى لعدد النتائج ، والعيب هو أنه لا تحتوي جميع محركات البحث على نفس صيغة لغة الاستعلام (على سبيل المثال ، لا يدعم كل محرك بحث علامات الاقتباس).


العناصر الرئيسية للغة استعلام محرك البحث دعنا نسرد العناصر والميزات المشتركة للغة استعلام محرك البحث: الأكثر استخدامًا: + أو - (قم بتضمين أو استبعاد المصطلح من وصفة البحث) ؛ "علامات الاقتباس" (لتعيين عبارة ، عبارة ثابتة). يستخدم البعض النقابات AND و AND NOT بدلاً من + أو -.


تسمح العناصر الأساسية للغة استعلام محرك البحث في الغالب بأحرف اقتطاع الكلمات على اليسار * (على سبيل المثال: Wish * - سيتم العثور عليها: Wish ، Wish ، Wishful ، Wishbone ، و Wishy-Washy) بعض محركات البحث حساسة للأحرف الكبيرة والصغيرة (على سبيل المثال ، إذا كنت تبحث عن مواد حول الأشخاص الذين يحملون اللقب Stone باستخدام Altavista ، فتأكد من استخدام حرف كبير ، وإلا فسيتم العثور على جميع المواقع التي تظهر فيها كلمة حجر).


العناصر الرئيسية للغة استعلام محرك البحث (باستخدام Yandex كمثال) العنصر ماذا يعني استعلام مثال الفضاء أو & أو + منطقي AND (ضمن جملة) قانون الأسرة && المنطقي AND (داخل المستند) وصفات && (الجبن المذاب) | المنطقية ORphoto | التصوير | لقطة | صورة فوتوغرافية


العناصر الرئيسية للغة استعلام محرك البحث (باستخدام Yandex كمثال) () تجميع الكلمات (التكنولوجيا | التصنيع) (الزبدة | الجبن القريش) ~ أو - الاتحاد وليس (ضمن الجملة) الفكر ~ القانون ~ ~ الاتحاد وليس (داخل المستند) guide in Paris ~~ (وكالة | جولة) "" ابحث عن عبارة "مختارات شعرية"


العناصر الرئيسية للغة استعلام محرك البحث (على سبيل المثال من Yandex)! قبل الكلمة ، الشكل الدقيق للكلمة! حقيقي! لحظة - يدخل هذا القانون حيز التنفيذ بعد أسبوعين من نشره. $ title ("") التعبير موجود في حقل العنوان لمستند HTML. $ title ("flora and fauna") - صفحات لها عناوين مشابهة لـ "Flora and fauna of Siberia"


وفي الختام: 1) من أجل بناء إستراتيجية بحث بشكل صحيح ، يجب عليك أولاً أن تقرر بنفسك نوع المعلومات التي تريد تلقيها - بعض المعلومات العامة التي تصف شيئًا أو ظاهرة ككل ، أو بعض التفاصيل ، يمكن أن تظهر في النص الكامل للمستند. في الحالة الأولى ، من المستحسن استخدام دليل ، في الحالة الثانية - محرك بحث. 2) إذا لم تكن لديك أي فكرة بالضبط عند بدء البحث عن ما تريد الحصول عليه في نتائج الاستعلام ومقدار ما تريده ، فمن المستحسن استخدام أدوات بحث مختلفة معًا.

ادوات البحث

أدوات البحث عبارة عن برامج خاصة ، والغرض الرئيسي منها هو توفير البحث الأمثل والأكثر جودة عن المعلومات لمستخدمي الإنترنت. تتم استضافة أدوات البحث على خوادم ويب خاصة ، يؤدي كل منها وظيفة محددة:

1. تحليل صفحات الويب وإدخال نتائج التحليل على مستوى أو آخر من قاعدة بيانات خادم البحث.

2. البحث عن المعلومات بناء على طلب المستخدم.

3. توفير واجهة سهلة الاستخدام للبحث عن المعلومات وعرض نتائج البحث من قبل المستخدم.

طرق العمل المستخدمة عند العمل مع أدوات البحث هذه أو غيرها هي نفسها تقريبًا. قبل الشروع في مناقشتها ، ضع في اعتبارك المفاهيم التالية:

1. يتم تقديم واجهة أداة البحث كصفحة بها ارتباطات تشعبية وسلسلة استعلام (سلسلة بحث) وأدوات تنشيط الاستعلام.

2. فهرس محرك البحث هو قاعدة معلومات تحتوي على نتيجة تحليل صفحات الويب ، يتم تجميعها وفقًا لقواعد معينة.

3. الاستعلام عبارة عن كلمة رئيسية أو عبارة يقوم المستخدم بإدخالها في شريط البحث. تُستخدم الأحرف الخاصة ("" ، ~) ، والرموز الرياضية (* ، + ،؟) لتكوين استعلامات متنوعة.

مخطط البحث عن المعلومات بسيط. يكتب المستخدم عبارة رئيسية وينشط البحث ، وبالتالي يتلقى مجموعة مختارة من المستندات وفقًا للطلب المصاغ (المقدم). يتم تصنيف قائمة المستندات هذه وفقًا لمعايير معينة بحيث تكون أعلى القائمة هي تلك المستندات الأكثر تطابقًا مع استعلام المستخدم. تستخدم كل أداة من أدوات البحث معايير مختلفة لترتيب المستندات ، سواء في تحليل نتائج البحث أو في تشكيل الفهرس (ملء قاعدة بيانات فهرس صفحات الويب).

وبالتالي ، إذا حددت استعلامًا من نفس التصميم في سلسلة البحث لكل أداة بحث ، فيمكنك الحصول على نتائج بحث مختلفة. بالنسبة للمستخدم ، من الأهمية بمكان تحديد المستندات التي ستظهر في أول عشرين أو ثلاثين مستندًا وفقًا لنتائج البحث وإلى أي مدى تتوافق هذه المستندات مع توقعات المستخدم.

تقدم معظم أدوات البحث طريقتين للبحث - بحث بسيط(بحث بسيط) و البحث المتقدم(بحث متقدم) مع وبدون استمارة طلب خاصة. دعنا نفكر في كلا نوعي البحث في مثال محرك بحث باللغة الإنجليزية.

على سبيل المثال ، يعد AltaVista مفيدًا للاستفسارات التعسفية ، "شيء ما عن الدرجات العلمية عبر الإنترنت في تكنولوجيا المعلومات" ، بينما تتيح لك أداة بحث Yahoo الحصول على أخبار العالم أو معلومات أسعار الصرف أو توقعات الطقس.

يتيح لك إتقان معايير تحسين الاستعلام وتقنيات البحث المتقدمة زيادة كفاءة البحث والعثور بسرعة على المعلومات الضرورية. بادئ ذي بدء ، يمكنك زيادة كفاءة البحث باستخدام عوامل التشغيل المنطقية (العمليات) أو ، و ، والقريب ، وليس ، والرموز الرياضية والخاصة في الاستعلامات. بمساعدة عوامل التشغيل و / أو الرموز ، يقوم المستخدم بربط الكلمات الرئيسية بالتسلسل المطلوب للحصول على نتيجة البحث الأكثر ملاءمة للاستعلام. يتم عرض نماذج الطلب في الجدول 1.

الجدول 1

يعطي الاستعلام البسيط عددًا من الارتباطات إلى المستندات ، لأن تتضمن القائمة المستندات التي تحتوي على إحدى الكلمات التي تم إدخالها عند الطلب ، أو عبارة بسيطة (انظر الجدول 1). يسمح لك عامل التشغيل and بتحديد أنه يجب تضمين جميع الكلمات الأساسية في محتوى المستند. ومع ذلك ، قد يظل عدد المستندات كبيرًا وقد يستغرق وقتًا طويلاً لمراجعتها. لذلك ، في بعض الحالات يكون من الأنسب استخدام عامل تشغيل السياق القريب ، مما يشير إلى وجوب وضع الكلمات على مقربة كافية في المستند. استخدام قريب يقلل بشكل كبير من عدد المستندات التي تم العثور عليها. يعني وجود الرمز "*" في سلسلة الاستعلام أنه سيتم البحث عن الكلمة بواسطة قناعها. على سبيل المثال ، دعنا نحصل على قائمة بالمستندات التي تحتوي على كلمات تبدأ بـ "gov" إذا كتبنا "gov *" في سلسلة الاستعلام. يمكن أن تكون هذه الكلمات حكومة ، حاكم ، إلخ.

يتم توفير خدمة البحث الأكثر تطورًا للحصول على معلومات باللغة الروسية بواسطة خادم بحث Yandex. في Yandex ، يمكنك ببساطة كتابة عبارة باللغة الروسية تصف ما تريد البحث عنه ، وسيقوم النظام بتحليل طلبك ومعالجته ، ثم محاولة العثور على كل ما يتعلق بموضوع معين. يمكنك ، باستخدام عوامل تشغيل خاصة ، تكوين سلسلة تشرح لمحرك البحث ما يجب أن تكون عليه متطلباتك للمعلومات التي تهتم بها.

يحتفظ محرك البحث المشهور أيضًا Rambler بإحصائيات حول حركة مرور الروابط من قاعدة البيانات الخاصة به ، نفس العوامل المنطقية AND ، OR ، NOT ، الحرف الأولي * (على غرار الحرف * في AltaVista الذي يوسع نطاق الاستعلام) ، رموز المعامل + و - هي مدعومة لزيادة أو تقليل الكلمات ذات الأهمية التي تم إدخالها في الاستعلام.

لنلقِ نظرة على أكثر تقنيات البحث عن المعلومات شيوعًا على الإنترنت.

محاضرة 4. أدوات استرجاع المعلومات

التحديث المستمر لصفيف المعلومات ، جنبًا إلى جنب مع الزيادة في حجم البيانات ، يجعل من الصعب للغاية مراعاة المستندات المتاحة ، وبالتالي البحث ، الذي يمكن تقسيمه بشكل مشروط إلى:

  • البحث الواقعي:في الموسوعات والكتب المرجعية والقواميس ،
  • البحث الببليوغرافي:المكتبات والأدلة والبرامج.
  • البحث عن الوثائق:الوثائق الإلكترونية والمكتبات الإلكترونية والمجلات الإلكترونية.

أدت أهمية مشكلة استرجاع المعلومات إلى تكوين صناعة كاملة ، مهمتها على وجه التحديد مساعدة المستخدم في التنقل في الفضاء السيبراني. تشكل هذه الصناعة خاصةخدمات البحثأو الخدمات. وهي مقسمة تقليديا إلى:

  • الدلائل أو الفهارس
  • محركات البحث

هذه الأصناف متشابهة جدًا من الناحية المرئية ، لأن"لكل دليل محرك بحث خاص به ، ولكل محرك بحث دليله الخاص". ومع ذلك ، فإن مبادئ عملهم تستند إلى أساليب وتقنيات مختلفة تمامًا. بالإضافة إلى ذلك ، يتم استخدام كل نوع من خدمات البحث في حل نوع معين من المشكلات. استرجاع المعلومات ينطوي على استخدام بعض الاستراتيجيات والطرق والآليات والأدوات. يتم تحديد سلوك المستخدم الذي يدير عملية البحث ليس فقط من خلال الحاجة إلى المعلومات ، ولكن أيضًا من خلال التنوع الفعال للنظام - التقنيات والأدوات التي يوفرها النظام. يحدد اختيار الأداة إلى حد كبيراستراتيجية البحث وتقنيات البحث.

تقنيات البحث- تسلسلات موحدة (محسّنة ضمن نظام استرجاع معلومات محدد) من أجل الاستخدام الفعال لأدوات البحث الفردية في عملية تفاعل المستخدم مع النظام.

تقنيات البحث المستخدمةيمكن تقسيم نظم المعلومات إلى 3 فئات:

  • كتالوجات مواضيعية وكتالوجات متخصصة (أدلة على الإنترنت) ؛
  • محركات البحث (البحث عن نص كامل) ؛
  • أدوات البحث الميتا.

كتالوجات مواضيعيةتنص على معالجة المستندات وإسنادها إلى فئة من عدة فئات ، قائمة محددة مسبقًا. في الواقع ، هذا مألوف لجميع المكتبيين.الفهرسة على أساس التصنيف. كتالوجات متخصصةأو أدلة يتم إنشاؤها في فروع وموضوعات منفصلة.محركات البحث(وسيلة البحث الأكثر تقدمًا على الإنترنت) تطبيق تقنية البحث عن النص الكامل. النصوص الموجودة على الخوادم المطلوبة مفهرسة.عند استخدام الأموال metasearch يتم تنفيذ الطلب في وقت واحد من قبل العديد من محركات البحث. يتم دمج نتيجة البحث في قائمة عامة ، مرتبة حسب الصلة.

ادوات البحث - مجمع مترابط من لغات استرجاع المعلومات ولغات تعريف / إدارة البيانات التي توفر تحويلات هيكلية ودلالية لكائنات المعالجة (المستندات والقواميس ومجموعات نتائج البحث).

1. الكتب المرجعية

أدوات البحث للمجموعة الأولى هي أدلة إلكترونية لها بنية هرمية منهجية أو منطقية موضوعية واضحة ،يشبه إلى حد كبير بنية فهرس مكتبة منهجي. يتيح لك العمل مع الدلائل التنقل في موارد الإنترنت ضمن فروع المعرفة الفردية ، والتنقيب من العام إلى الخاص ، وتغيير الفروع الهرمية ، والرجوع إلى الوراء بضع خطوات ، وما إلى ذلك.

ومن التطورات الروسية في هذا المجال:

  • Aport (العنوان: www.aport.ru) ،
  • List.ru (العنوان: list.mail.ru) ،
  • قائمة الويب (العنوان: www.weblist.ru) ،
  • إيفان سوزانين (العنوان: www.susanin.net
  • الحلزون (العنوان: www.ulitka.ru).

السمة المميزة الرئيسية للكتب المرجعية هي أنها مصنوعة يدويًا. وتعتبر مجالس التحرير لكل من الكتب المرجعية التيوبحكم طبيعة عملهم ، فإنهم يشبهون أقسام الفهرسة والتنظيم في المكتبات الكبيرة, قم بمراجعة محتويات الخوادم التي ظهرت حديثًا بانتظام وتتبع التغييرات على الخوادم الموجودة. يتم تحليل البيانات التي تم الكشف عنها وإدخالها في أقسام الكتاب المرجعي وفقًا للتصنيف المقبول. يتم توفير وصف الخادم ككل (أو القسم ، إذا بدا أنه كتلة مستقلة تمامًا) مع تعليق توضيحي موجز يحتوي على معلومات عامة حول طبيعة المعلومات المتاحة. في بعض الحالات ، يتم إدخال معلومات إضافية حول لغة المستندات ، وحضور المورد ، وموقعه الفعلي ، وما إلى ذلك.

المعلمات الرئيسية التي تميز مزايا الدلائل هي:

  • الصوت؛
  • كفاءة عكس الموارد الجديدة أو المتغيرة ؛
  • اتساق واتساق مخطط التصنيف الهرمي ؛
  • كروس الهيكل.

يحدد حجم الدليل درجة موثوقيته أو "قوة المعلومات ". في بعض الأنظمة ، توجد آلية خاصة تتحقق بشكل دوري من توفر الموقع وتستبعده من القائمة في حالة "الغياب" الطويل على الويب. يحدد المنطق (العلمي) لنظام التصنيف المطبق درجة السهولة التي يجد بها المستخدمون المعلومات المطلوبة. نظامعبر المراجعيسمح لك بتحديد المعلومات باستخدام مناهج مختلفة (على سبيل المثال ، الإقليمية أو القطاعية). في هذه الحالة ، يجب أن يوجه مخطط التصنيف المستخدم تلقائيًا إلى الكائن المطلوب ، بغض النظر عن مسار البحث الذي تم اختياره.

لا تلعب إمكانية تجميع استعلام لهذا النوع من أدوات البحث دورًا خاصًا. لا يتم إجراء عمليات البحث المعقدة التي تتطلب تفصيل الطلب باستخدام الفهارس.

الدلائل مصممة لحلثلاثة أنواع من المهام:

  • التوجه في فرع غير مألوف من المعرفة ؛
  • البحث عن الأشياء الكبيرة ، على سبيل المثال ، خوادم المنظمات أو المشاريع الهامة ؛
  • الحصول على قائمة جاهزة بالموارد التي تحتوي على صورة بحث غير واضحة (مكتبات من نوع معين أو جداول نقل أو مواقع ويب للأحزاب السياسية ، إلخ)

مثال آخر هو مقارنة دليل الموارد بالفهرس النظامي للمكتبة ، حيث يُترك كتاب (في هذه الحالة ، موقع بأكمله) مع وصف وتعليق فقط.

2. محركات البحث

يعتمد عمل محركات البحث (محركات البحث) على مبادئ تكنولوجية مختلفة تمامًا. تتمثل مهمة محركات البحث في توفير بحث مفصل عن المعلومات ، والتي لا يمكن تحقيقها إلا من خلال المحاسبة (الفهرسة ) محتوى أكبر عدد ممكن من صفحات الويب. على عكس الدلائل ، تعمل محركات البحث في وضع آلي ولها مبدأ تشغيل موحد.

تتكون محركات البحث من عنصرين أساسيين. المكون الأول هوبرنامج الروبوت ، وتتمثل مهمتها في الانتقال من خادم إلى خادم والعثور على مستندات جديدة (أو تم تغييرها) هناك ، وتنزيلها على الكمبيوتر الرئيسي للنظام. يبحث الروبوت في محتوى المستند ، ويجد ارتباطات جديدة ، إلى كل من المستندات الأخرى الموجودة على الخادم والمواقع الخارجية. ثم ينتقل البرنامج بشكل مستقل إلى الروابط المحددة ، ويجد مستندات جديدة ، وبعد ذلك تتكرر العملية مرة أخرى ،مذكرا "بطريقة كرة الثلج" المعروفة في الببليوغرافيا. تتم معالجة الوثائق المحددة (فهرستها) بواسطة المكون الثاني لمحرك البحث. في هذه الحالة ، كقاعدة عامة ، يتم أخذ جميع محتويات الصفحة في الاعتبار ، بما في ذلك النصوص والرسوم التوضيحية وملفات الصوت والفيديو. تتم فهرسة جميع الكلمات الموجودة في المستند ، مما يجعل من الممكن استخدام محركات البحث لإجراء عمليات بحث تفصيلية حول أضيق الموضوعات. تشكلتملفات الفهرس ، وتخزين المعلومات حول الكلمة الأساسية ، وعدد المرات ، وفي أي مستند وعلى أي خادم يتم استخدامه ، تشكل قاعدة البيانات التي يصل إليها أمين المكتبة عند إدخال مجموعات من الكلمات الأساسية في سلسلة الاستعلام.

يتم إخراج النتائج باستخدام وحدة خاصة تنتجالترتيب الذكي للنتائج . هذا يأخذ في الاعتبار:

  • موقع المصطلح في المستند (العنوان ، العنوان ، النص الأساسي) ، وتيرة تكراره ،
  • النسبة المئوية لمصطلح البحث إلى نص الصفحة ،
  • عدد وسلطة الروابط الخارجية لهذه الصفحة من مواقع أخرى.

إلى المعلمات الأساسية لمحركات البحثترتبط:

  • عدد الخوادم المفهرسة والوثائق الفردية (حجم ملفات الفهرس) ؛
  • درجة كفاءة تحديث قاعدة البيانات من خلال تضمين معلومات حول المواد الجديدة وحذف المواد القديمة ؛
  • إمكانيات تقديم الطلب ؛
  • ذكاء نظام ترتيب نتائج البحث ؛
  • وجود وظائف خدمية إضافية تسهل عمل المستخدم.

تحدد قدرة محرك البحث على التعبير عن استعلام بأكبر قدر ممكن من الدقة جودة النتائج التي يتم الحصول عليها. كل آلة لها مفرداتها الخاصة ، والتي تسمح لك بالتفاصيل بطرق مختلفةوصفة البحث.

جميع محركات البحث لهاوحدة ترتيب نتائج البحث. إنه المكون الأساسي الثاني لجميع الأنظمة. قائمة العوامل التي تؤخذ في الاعتبار عند تحديد مكان المستند في قائمة الروابط واسعة بشكل غير عادي: من موقع الكلمة على الصفحة إلى تصنيف (سلطة) الصفحات التي ترتبط بالمستند الذي تم العثور عليه.

  • Google (العنوان: www.google.com) ،
  • AlltheWeb (العنوان: www.alltheweb.com) ،
  • Alta Vista (العنوان: www.altavista.com).

توجد أدوات بحث مماثلة في روسيا. تم تصميم كل منهم للعمل مع المستندات باللغة الروسية ولديها قوية http://www.metabot.ru).

استنتاجات حول موضوع كتلة المحاضرة

يقوم محرك البحث باختيار الصفحات من قاعدة البيانات وفقًا للطلب ، ثم يتم ترتيب الصفحات حسب درجة تناقص التطابقات (الملاحظة A.A.)

في هذه الحالة ، هناك تشابه مباشر مع مبادئ تشغيل الفهارس الموجزة الموزعة للمكتبة. فرصة رئيسيةبحث ميتا هي القدرة على إرسال طلبات المستخدم في وقت واحد إلى مختلف محركات البحث - مع تلخيص لاحق للنتائج. (ملاحظة من A.A.)

بالانتقال إلى الدلائل ، يمكن لأمين المكتبة أن يتوقع فقط الحصول على معلومات عامة جدًا عن الموضوع ، وليس بيانات مفصلة أبدًا: من خادم شركة كبيرة تحتوي على آلاف الصفحات ، سيعرض الدليل فقط الاسم وبضعة سطور من التعليقات التوضيحية.

جار التحميل...
قمة