مطالب پیشین مرتبط با لوسین را در اینجا میتوانید پیگیری کنید. آخرین نگارش آن که تا این تاریخ، 4.8 بتا است، با داتنت(Core) سازگار است و روش برپایی آغازین آن ... تغییرات قابل توجهی داشتهاست که خلاصهی آنها را در این مطلب بررسی خواهیم کرد. 1) بستههای جدید مورد نیاز برای کار با لوسین جدید، نیاز است حداقل سهبستهی زیر را نصب کنیم تا به امکانات پایهای و کوئری گیریهای پیشرفتهی آن دسترسی داشته باشیم: <PackageReference I ...
مقدمه ای بر Latent Semantic Indexing
هنگامیکه برای اولین بار، جستجو بر مبنای کلمات کلیدی (keyword search) بر روی مجموعهای از متون، به دنیای بازیابی اطلاعات معرفی شد شاید فقط یک ذهنیت مطرح میشد و آن یافتن لغت در متن بود. به بیان دیگر در آن زمان تنها بدنبال متونی میگشتیم که دقیقا شامل کلمه کلیدی مورد جستجوی کاربر باشند. روال کار نیز بدین صورت بود که از دل پرس و جوی کاربر، کلماتی بعنوان کلمات کلیدی استخراج میشد. سپس الگوریتم ج ...
احتمالا یک سری از کارهای اینفوگرافیک مانند tags cloud و words cloud را دیدهاید. برای مثال در یک سخنرانی خاص، سخنران بیشتر از چه واژههایی استفاده کرده است و سپس ترسیم درشتتر واژههایی با تکرار بیشتر در یک تصویر نهایی. محاسبات آماری این نوع بررسیها را توسط لوسین نیز میتوان انجام داد که در ادامه به نحوه انجام آن خواهیم پرداخت.
بررسی آماری واژههای بکار رفته در شاهنامه
مرحله اول: ایجاد ایندکس
...
پیشنیاز:
چگونه با استفاده از لوسین مطالب را ایندکس کنیم؟
مقدمه
اگر به جستجوی سایت دقت کرده باشید، قابلیتی تحت عنوان پیشنهاد «عبارات مشابه» به آن اضافه شده است:
این مورد بر اساس ماژول غلط یاب املایی لوسین تهیه شده و بسیار شبیه به "did you mean" جستجوی گوگل است. در ادامه به نحوه پیاده سازی آن خواهیم پرداخت.
...
پیشنیازها:
چگونه با استفاده از لوسین مطالب را ایندکس کنیم؟
چگونه از افزونه jQuery Auto-Complete استفاده کنیم؟
نحوه استفاده صحیح از لوسین در ASP.NET
اگر به جستجوی سایت دقت کرده باشید، قابلیت ارائه پیشنهاداتی به کاربر توسط یک Auto-Complete به آن اضافه شدهاست. در مطلب جاری به بررسی این مورد به همراه دو مثال Web forms و MVC پرداخته خواهد شد.
قسمت عمده مطلب جاری با پیشنیازهای یاد شده ف ...
موتور لوسین علاوه بر فراهم آوردن امکان جستجوی سریع بر روی متون حجیم، امکان یافتن مطالبی مشابه یا مرتبط با مطلبی خاص را نیز فراهم میکند. نمونه آنرا شاید در بعضی از انجمنها یا وبلاگها دیده باشید که در ذیل مطلب جاری، چندین لینک را به مطالبی مشابه نیز نمایش میدهند. در ادامه نحوه استفاده از این قابلیت را در لوسین بررسی خواهیم کرد.
یافتن شماره سند متناظر لوسین
همان مثال «استفاده از لوسین برای برجسته سازی عبارت ...
بر مبنای پیاده سازی متداولی که در n هزار سایت اینترنتی میتوان یافت، نحوه کار با جستجوگر لوسین حدودا به این شکل است:
var directory = FSDirectory.Open(new DirectoryInfo(Environment.CurrentDirectory + "\\LuceneIndex"));
using (var searcher = new IndexSearcher(directory, readOnly: true))
{
//do something ...
searcher.Close();
directory.Close();
}
و ... اینکار به این شکل غلط است!
مطابق مستندات رسمی لوسین ...
قسمت جستجوی سایت جاری رو با استفاده از لوسین بازنویسی کردم. خلاصهای از نحوه انجام اینکار رو در ادامه ملاحظه خواهید کرد:
1) دریافت کتابخانههای لازم
نیاز به کتابخانههای Lucene.NET و همچنین Lucene.Net Contrib است که هر دو مورد را به سادگی توسط NuGet میتوانید دریافت و نصب کنید.
Highlighter استفاده شده، در کتابخانه Lucene.Net Contrib قرار دارد. به همین جهت این مورد را نیز باید جداگانه دریافت کرد.
...
به صورت خلاصه اگر نیاز به جستجوی سریع و پیشرفتهای بر روی حجم عظیمی از اطلاعات دارید، روش متداول select * from table where field like something توصیه نمیشود. بسیار کند است؛ مصرف CPU بالایی دارد. از ایندکس استفاده نمیکند.
راه حل توصیه شده جهت برخورد با این نوع مسایل استفاده از full text search است. نگارش کامل SQL Server حاوی یک موتور FTS توکار هست . اگر از بانک اطلاعاتی خاصی استفاده میکنید که دارای موتور FTS نیست یا .. ...