Faculty Profile

پرهام مرادی دولت آبادی
تاریخ به‌روزرسانی: 1403/10/20

پرهام مرادی دولت آبادی

دانشکده مهندسی / گروه مهندسی کامپیوتر و فناوری اطلاعات

Theses Faculty

پایان‌نامه‌های کارشناسی‌ارشد

  1. بهبود پیش‌بینی پیوند بدون ناظر با لحاظ کردن معیارهای مرکزیت
    1403
    پیش‌بینی پیوندهای احتمالی در شبکه‌های پیچیده یکی از چالش‌های مهم در تحلیل شبکه است. این مسئله کاربردهای مهمی در زمینه‌هایی مانند شبکه‌های اجتماعی، زیستی و حمل و نقل دارد. به عنوان مثال، در شبکه‌های اجتماعی، پیش‌بینی پیوندهای احتمالی می‌تواند به پیشنهاد دوستان بالقوه کمک کند و تجربه کاربری را بهبود ببخشد. در شبکه‌های زیستی نیز، پیش‌بینی دقیق‌تر تعاملات پروتئینی می‌تواند به پیشرفت‌های قابل توجهی در کشف دارو و درک مکانیسم‌های بیولوژیکی منجر شود. با این حال، روش‌های سنتی پیش‌بینی پیوند محدودیت‌هایی در دقت و نقش گره ها در شبکه را دارند. این پژوهش یک رویکرد نوآورانه را برای بهبود دقت پیش‌بینی پیوند در شبکه‌های پیچیده ارائه می‌دهد. روش پیشنهادی با ترکیب هوشمندانه الگوریتم‌های پایه پیش‌بینی پیوند (مانند CN، JC، RA، AA و PA) با معیارهای مرکزیت گره (درجه، بینابینی، نزدیکی، بردار ویژه و رتبه صفحه) طراحی شده است. این ترکیب به بهره‌گیری هم‌زمان از ساختار محلی شبکه و اهمیت کلی گره‌ها منجر می‌شود. نتایج ارزیابی روش پیشنهادی بر روی ده مجموعه داده متنوع نشان داد که این روش در اکثر موارد عملکرد بهتری نسبت به روش‌های پایه داشته است. به عنوان مثال، در شبکه lesmis، روش PA بهبودیافته با معیار بردار ویژه به Precision برابر با 0.3152 دست یافت که بهبود قابل توجهی نسبت به روش پایه PA (Precision برابر با 0.1567) بود. این بهبود عملکرد به ویژه در شبکه‌های بزرگ‌تر و پیچیده‌تر مشهودتر بود و همچنین در شبکه های کوچک عالی عمل کرد. همچنین، مطالعه نشان داد که انتخاب بهترین روش برای پیش‌بینی پیوند به ویژگی‌های خاص هر شبکه بستگی دارد. به عنوان مثال، در شبکه Karate، روش PA بهبودیافته با معیار درجه بهترین عملکرد را داشت، در حالی که در شبکه Jazz، روش AA بهبودیافته با معیار بردار ویژه بهترین نتیجه را ارائه داد. این یافته‌ها اهمیت در نظر گرفتن ساختار و ویژگی‌های خاص هر شبکه را در انتخاب روش مناسب برای پیش‌بینی پیوند نشان می‌دهد. این پژوهش گامی مهم در جهت بهبود دقت پیش‌بینی پیوند در شبکه‌های پیچیده برداشته است. با این حال، این مطالعه دارای برخی محدودیت‌ها نیز بود. با توجه به این محدودیت‌ها و نتایج به دست آمده، چندین مسیر برای تحقیقات آینده پیشنهاد می‌شود. این شامل توسعه روش‌های پیش‌بینی پیوند که قادر به در نظر گرفتن پویایی شبکه باشند، آزمودن روش‌های پیشرفته‌تر مرکزیت، بهبود کارایی محاسباتی الگوریتم‌ها، ترکیب روش‌های پیشنهادی با تکنیک‌های پیشرفته یادگیری ماشین و بررسی تاثیر سایر ویژگی‌های شبکه بر پیش‌بینی پیوند می‌باشد.
  2. Drug Abuse Detection Improvement using Graph Analysis Techniques
    1403
    Drug abuse remains one of the most significant public health challenges globally, affecting millions and resulting in profound social and economic consequences. Traditional detection methods, largely reliant on self-reporting and clinical assessments, often fall short in capturing the complex reality of substance use behaviors. As substance abuse continues to evolve, innovative approaches are required to enhance detection, prevention, and intervention strategies while providing healthcare professionals and policymakers with robust data-driven insights. This study utilized the UCI dataset on drug consumption, comprising 1885 respondents with 12 attributes including personality traits, demographic information, and drug consumption behavior. We employed graph analysis techniques to enhance drug abuse detection, focusing on nicotine consumption. previous work used machine learning, we also used machine learning except that we added new features that we get from the graph. Our methodology involved data preprocessing, correlation analysis using Spearman's coefficient, graph construction with different thresholds for nicotine users and non-users, and feature extraction from the resulting graphs. We extracted seven centrality measures: Degree, Betweenness, Closeness, Eigenvector, Pagerank, Harmonic, and Load Centrality. We then combined these graph-derived features with the original dataset and applied various machine learning models for classification. The results demonstrated strong predictive performance, with the best model (Logistic Regression) achieving an accuracy of 0.985964 and an AUC of 0.999015. Other models, including Histogram-based Gradient Boosting, MLP, and SVM, also showed high accuracy above 0.85. This represents a significant improvement over recent studies in the field of drug abuse detection. Future research should focus on validating these results on diverse external datasets to ensure generalizability. Exploring temporal dynamics within drug abuse networks and integrating advanced techniques like Graph Neural Networks could further enhance the methodology. Additionally, expanding the approach to other substances and behavioral health issues could provide a more comprehensive understanding of addiction patterns. Ethical considerations regarding the use of highly accurate predictive models in healthcare settings should also be carefully addressed to ensure responsible application of these techniques.
  3. روشی جدید مبتنی بر تحلیل شبکه برای پیش‌بینی انصراف از تحصیل دانشجویان
    1403
    انقلاب آموزشی در فضای دیجیتال با ظهور دوره‌های آنلاین باز گسترده (MOOCs) به مرحله جدیدی وارد شده است. این پدیده، که در سال‌های اخیر رشد چشمگیری داشته، با چالش‌هایی مانند نرخ بالای افت تحصیلی و درصد پایین تکمیل دوره‌ها مواجه است. پژوهش حاضر به بررسی روش‌های نوین تحلیل و طبقه‌بندی داده‌های آموزشی برای پیش‌بینی انصراف از تحصیل دانشجویان می‌پردازد. داده‌های مرتبط با آموزش آنلاین شامل اطلاعات تعاملی، پیشرفت تحصیلی و محتوای دیجیتال هستند که به تحلیل کیفیت و اثربخشی مواد آموزشی کمک می‌کنند. مجموعه داده‌های مورد استفاده از سیستم مدیریت یادگیری دانشگاه به دست آمده و شامل اطلاعات تحصیلی و رفتاری دانشجویان است. این پژوهش دقت پیش‌بینی را در میان دانشجویان در معرض خطر انصراف و دانشجویانی که به تحصیل ادامه می‌دهند، بررسی می‌کند. استفاده از روش‌های نوین تحلیل داده‌ها می‌تواند دقت پیش‌بینی را بهبود بخشد. در این پژوهش، ابتدا سامانه و داده‌های آموزشی آنلاین معرفی می‌شوند و سپس به داده‌کاوی آموزشی و مسئله انصراف از تحصیل دانشجویان پرداخته می‌شود. اهمیت تشخیص زودهنگام دانشجویان در معرض انصراف مورد بحث قرار گرفته و داده‌ها به گراف تبدیل می‌شوند تا روابط و الگوهای پیچیده تحلیل شوند. ویژگی‌های گرافی موثر برای ارائه اطلاعات درباره الگوهای رفتاری و تحصیلی دانشجویان استخراج می‌شوند. برای پیش‌بینی انصراف از تحصیل، سه روش بررسی شده است. در روش اول، از داده‌های Harvard and MIT با ۲۲ ویژگی، ۶ ویژگی جدید استخراج شده است. در روش دوم، داده‌های KDDCup با ۱۵ ویژگی و ۵ ویژگی محلی جدید بررسی شده‌اند. در روش سوم، با تبدیل داده‌ها به دو مجموعه مجزا، ۵ ویژگی محلی و ۵ ویژگی سراسری جدید استخراج گردیده است. در نهایت، با معیارهای مختلف طبقه‌بندی، دانشجویان در معرض انصراف شناسایی می‌شوند و این رویکرد می‌تواند به شناسایی دقیق‌تر دانشجویان در خطر و مداخلات به‌موقع کمک کند. نتایج این پژوهش نشان‌دهنده تاثیر مثبت رویکرد مبتنی بر گراف در تحلیل داده‌های آموزشی و بهبود دقت پیش‌بینی انصراف از تحصیل دانشجویان است. این روش کارآمدتر از روش‌های سنتی بوده و به موسسات آموزشی در شناسایی سریع‌تر دانشجویان در معرض خطر و اتخاذ اقدامات پیشگیرانه کمک می‌کند. ساختار گراف امکان بررسی روابط پیچیده بین ویژگی‌های آموزشی را فراهم کرده و ویژگی‌های موثرتر را استخراج می‌کند. در روش پیشنهادی اول، معیار InfoMap بهترین عملکرد را داشت. روش دوم دقت پیش‌بینی را 5.33 درصد و روش سوم دقت را 6.04 درصد بهبود بخشید و به دقت 100 درصد رسید. این یافته‌ها نشان می‌دهد که استخراج و ترکیب ویژگی‌های مناسب می‌تواند دقت پیش‌بینی انصراف از تحصیل در MOOCs را به طور قابل توجهی افزایش دهد. این پژوهش با وجود نتایج مثبت، دارای محدودیت‌هایی نیز می‌باشد. یکی از چالش‌های اصلی، دشواری در مدیریت و پردازش مجموعه داده‌های بزرگ است که می‌تواند فرآیند تحلیل را زمان‌بر کند. برای غلبه بر این محدودیت، می‌توان از روش‌های گراف‌های عمیق استفاده کرد که امکان تحلیل سریع‌تر و کارآمدتر داده‌ها را فراهم می‌کنند. در کارهای آینده، می‌توان از روش‌های پیشرفته تشخیص اجتماع برای استخراج ویژگی‌های متعدد بهره برد و یا از کدگذاری‌های مختلف برای استخراج ویژگی‌ها استفاده کرد. این رویکردها نه تنها می‌توانند به افزایش کارایی در پردازش داده‌های حجیم کمک کنند، بلکه امکان کشف الگوهای پنهان و پیچیده‌تر در داده‌های آموزشی را نیز فراهم می‌آورند، که می‌تواند منجر به پیش‌بینی‌های دقیق‌تر و جامع‌تر در زمینه انصراف از تحصیل دانشجویان شود.
  4. بهبود یک سیستم توصیه گر چند ذینفع با استفاده از الگوریتم تکاملی چند هدفه مبتنی بر تجزیه
    1402
    در بسیاری از موارد، کاربر نهایی تنها ذینفع یک سیستم توصیه گر نیست و بای د توجه به نیازها و انتظارات سایر ذینفعان نیز داشته باشیم . این چالش به ویژه در پلتفرمهای چند جانبه مانند بازارهای آنلاین که خریداران و فروشندگان را در یک مکان گرد هم میآورند، به وجود میآید . مثالهای ارائه شده نشان میدهد که در برخی حوز هها، کاربران تنها ذینفع نیستند و سایر اشخاص و شرکتها نیز در فرآیند تصمیمگیری و انجام تعاملات مشارکت دارند. این موضوع مهم است زیرا تمرکز انحصاری بر روی نیازها و ترجیحات کاربر نهایی ممکن است به نتایج نامطلوبی برای دیگر ذینفعان منجر شود . برای رفع این مشکل روش پیشنهادی این پژوهش ارائه یک سیستم توصیه گر چند ذینفع با استفاده از الگوریتم تکاملی چند هدفه مبتنی بر تجزیه است به منظور ارزیابی اثربخشی راه حل و مقایسه آن با کارهای موجود، از معیارهای میانگین خطای مطلق، تنوع محصولات و پوشش ارائه دهندگان استفاده شده است، نتایج پژوهش نشان داد که روش پیشنهادی در مقایسه با الگوریتم ژنتیک چند هدفه در مجموعه داده های ML100K و ML1M به ترتیب به مقادیر 38.17 % و 49.79 % برای پوشش ارائه دهندگان ، 17.41 % و 18.62% مقادیر بالاتر برای تنوع محصولات ، و تنها 55.12 % و 52.58 % از دست دادن دقت در مقایسه با الگوریتم ژنتیک ارائه کرده است که نشان دهنده عملکرد بهتر روش پیشنهادی است. به عبارتی روش پیشنهادی تعداد بیشتری از ارائه دهندگان را تحت پوشش قرار داده است به طوری که باعث افزایش خدمات و رضایت بیشتر ارائه-دهندگان و تنوع محصولات پیشنهادی شده است.
  5. استفاده از الگوریتم بهینه سازی سیاسی به منظور دستیابی به عدالت در سیستم‌های پیشنهاد دهنده چند ذی‌نفع
    1402
    به‌منظور دستیابی به-Pعادلانه، ممکن است بیش از یک جواب بیشینه محلی یا کمینه محلی وجود داشته باشد که لزوماً همه آن‌ها بهینه سراسری مسئله موردنظر نخواهند بود. اگرچه الگوریتم ‌‌های بهینه‌سازی چندهدفه می‌تواند راهگشای حل این مسائل باشد، اما این الگوریتم ‌ها دارای مشکلاتی مانند گیر افتادن در بهینه محلی به دلیل هم‌گرایی زودرس، توانایی ناکافی برای یافتن نقاط انتهایی نزدیک( یعنی مشکل بهره‌برداری )، و فقدان مکانیسم کارآمد برای درمان محدودیت ‌ها( یعنی مشکل رسیدگی به محدودیت) هستند. برای حل این محدودیت‌ها، الگوریتم‌های بهینه‌سازی رقابتی – اجتماعی ارائه‌شده‌اند. یکی از الگوریتم‌های جدید ارائه‌شده مبتنی بر رقابت اجتماعی – سیاسی الگوریتم بهینه‌سازی سیاسی (PO) است. الگوریتم بهینه‌سازی سیاسی نگاشتی از مراحل اصلی سیاست ازجمله اختصاص حوزه انتخابیه، تغییر حزب، مبارزات انتخاباتی، انتخابات میان احزاب و امور مجلسی است. در الگوریتم POفهرست‌های پیشنهادی به‌عنوان راه‌حل‌های کاندید برای سیستم‌های پیشنهاد دهنده چند ذی‌نفع در نظر گرفته می شود و بهترین راه حل کاندید در هر مرحله، بعنوان بهترین لیست پیشنهادی، یا جواب تقریبا بهینه در نظر گرفته می شود. لذا هدف از ارائه این پژوهش بهبود سیستم‌های پیشنهاد دهنده چند ذی‌نفع بر اساس الگوریتم بهینه سازی سیاسی (PO) است. به منظور اعتبارسنجی راه‌حل پیشنهادی تحت رفتار رتبه‌بندی کاربران مختلف، ما مجموعه‌ای از آزمایش‌ها را بر روی دو مجموعه داده واقعی انجام دادیم. این مجموعه داده ها MovieLens 100 K و MovieLens 1 M هستند. روش‌های مورد ارزیابی PO _RSو CF-RS, NSGA - II – RS, MOEA/D-RS در پژوهش ارزیابی شده است.میانگین خطای مطلق(MAE) ما از معیار MAE برای اندازه گیری دقت توصیه لیست های توصیه برای همه کاربران استفاده می کنیم پوشش ارایه دهندگان ما این معیار را برای اندازه گیری پوشش ارایه دهنده در PF معرفی می کنیم خطای پیش بینی روش پیشنهادی PO_RS در مجموعه داده ML١۰۰K برابر با ۵۰ درصد است که نسبت به روش ‌‌های دیگر که خطا ‌‌های بالای ۶۰ درصد داشته ‌اند عملکردی مناسب تری داشته است اما تنوع کمتری نسبت به روش های دیگر داشته است همچنین تعادل در روش پیشنهادی در مجموعه داده ML100K در سطح مناسب 49.91 درصد قرار دارد. خطای پیش بینی روش پیشنهادی PO_RS در مجموعه داده ML1M برابر با 46.29 درصد است که نسبت به روش های توصیه گر چند هدفه مبتنی بر تجزیه ، توصیه گر مبتنی بر ژنتیک دو هدفه و روش پالایش مشارکتی مبتنی بر کاربر که خطا های بالای 50 درصد داشته اند، عملکردی مناسب تری داشته است.نتایج پژوهش نشان می‌دهد که با ایجاد وزن بیشتر در سمت هدف اول که همان تنوع طلبی کاربران است، از یک سو موجب افزایش رضایت کاربران خواهد شد و از طرفی تعداد محصولات ارایه شده فروشندگان افزایش می‌یابد به عبارتی اگر وزن اهداف را به صورت w_ ١=۶۰ w_۲=۲۰ w_۳=۲۰ تعریف کنیم بهترین نتیجه ممکن از سیستم تصویه گر حاصل می‌گردد.
  6. بهبود کارایی پیش‌بینی پیوند چندلایه با استفاده موثر از کشف اجتماع و مرکزیت
    1402
    یکی از موضوعاتی که به شدت در تحلیل شبکه مورد مطالعه قرار گرفته است، مسئله پیش‌بینی پیوند است که اهمیت فراوانی در مسائل زیستی، علمی و شبکه‌های اجتماعی و ... دارد و عبارت است از: امتیاز دادن به یال‌های غیرموجود. نوع خاصی از پیش‌بینی پیوند که کاربردهای زیادی دارد، پیش‌بینی پیوند در شبکه‌های چند لایه است که دو نوع اصلی از شبکه‌های چندلایه عبارتنداز: 1) شبکه‌های چندگانه که در آن تعداد و نوع گره‌ها در تمام لایه‌ها یکسان بوده و پیوند‌های بین‌لایه‌ای که گره‌ها را در دو لایه به‌هم متصل می‌کند به صورت یک به یک است و در واقع گره‌های با ماهیت یکسان را به‌هم متصل می‌کند و اما 2) شبکه‌های به‌هم پیوسته که در آن تعداد و نوع گره‌ها در لایه‌ها لزوما یکسان نیست و همچنین پیوند‌‌های بین‌لایه‌ای غیر یک ‌به یک بوده و گره‌های با ماهیت متفاوت را به‌هم متصل می-کند و همچنین هر گره از هر لایه می‌تواند به هر گره از لایه دیگر متصل شود. پیش‌بینی پیوند در شبکه‌های چند لایه به دو صورت انجام می‌پذیرد: 1) پیش‌بینی پیوند درون لایه‌ای که در آن پیوند‌های ناموجود در درون یک لایه پیش‌بینی می‌شود و 2) پیش‌بینی پیوند بین لایه‌ای که در آن پیوندهای بین لایه‌ای ناموجود بین دو لایه مختلف پیش‌بینی می‌شود. بیشتر مطالعاتی که تاکنون انجام شده است بر پیش‌بینی پیوند درون لایه‌ای تمرکز داشته‌اند و مطالعه در زمینه پیش‌بینی پیوند بین لایه‌ای هنوز در مراحل اولیه است و اینکه مطالعاتی که تاکنون در زمینه پیش‌بینی پیوند بین لایه‌ای انجام شده‌اند همگی بر روی شبکه-های چندگانه که در واقع زیر مجموعه‌ای از شبکه چند لایه است با کمینه تعداد لایه (2 لایه) کار کرده‌اند، به همین دلیل در این پایان‌نامه ما پیش‌بینی پیوند بین لایه‌ای را در شبکه‌های چند لایه به‌هم پیوسته بدون محدودیت در تعداد و نوع گره‌ها در لایه‌ها، تعداد لایه‌ها و تعداد پیوندهای بین لایه‌ای انجام می‌دهیم. برای این کار از سه رویکرد: 1) تبدیل شبکه چند لایه به شبکه‌های مسطح 2) کاهش شبکه چند لایه به شبکه‌های دو بخشی و 3) بهره‌‌گیری از کشف اجتماع و مرکزیت برای انجام پیش‌بینی پیوند بین لایه‌ای کمک می‌گیریم. الگوریتم‌های مورد استفاده در پیش‌بینی پیوند، الگوریتم‌های پایه: همسایگان مشترک، ضریب جاکارد، پیوست ترجیحی و آدامیک آدار هستند و رویکرد کشف اجتماع استفاده شده در این کار، الگوریتم‌ معروف گیروان-نیومن است. همچنین از معیار مرکزیت نزدیکی برای تعیین اهمیت گره‌ها، استفاده شده است. مجموعه داده‌های استفاده شده در این کار شامل: شبکه‌ 3 لایه برگرفته از متن فیلم‌نامه، فیلم معروف "The Avengers 2012" و شبکه‌های 3، 4 و 5 لایه سریال "Star Wars" است. در نهایت نتایج دقت رویکردهای پیشنهادی در چهار فاز: 1) پیش‌بینی پیوند بین لایه‌ای از طریق شبکه مسطح، 2) پیش‌بینی پیوند بین لایه‌ای از طریق شبکه دو بخشی، 3) پیش‌بینی پیوند بین لایه‌ای از طریق ترکیب نتایج رویکرد اول و دوم برای بهبود نتایج دقت پیش‌بینی پیوند از طریق شبکه دو بخشی و 4) پیش‌بینی پیوند بین لایه‌ای از طریق ترکیب نتایج رویکرد اول و دوم و سوم که بهره‌گیری از کشف اجتماع و مرکزیت است، ارائه می‌شود که به طور کلی هدف از ارائه فاز سوم و چهارم که برای محاسبه دقت از ترکیب نتایج رویکردهای پیشنهادی استفاده می‌کنند، بهبود دقت نتایج فازهای اول و دوم است و با توجه به نتایج ارائه شده بهترین عملکرد مربوط به فاز سوم (پیش‌بینی پیوند بین لایه‌ای از طریق ترکیب رویکرد مسطح نمودن شبکه و کاهش به شبکه دوبخشی) است. همچنین بهترین نتایج برای AUC برای شبکه چهار لایه Star Wars 3 و شبکه پنج لایه Star Wars 2 با مقدار بیش از 0.9 برای فازهای سوم و چهارم به ازای هر چهار معیار امتیازدهی پیش‌بینی پیوند بدست آمد.
  7. Improving Community Detection Using Mixed Link Prediction
    1402
    Community detection means dividing the nodes in complex networks into different groups. Nodes within the same group are closely connected, while nodes in different groups have fewer connections. Community detection is fundamental problem in network analysis, aiming to uncover the underlying structures and organization within complex networks. Traditional methods focus on network topology, neglecting valuable information contained in different types of links. Improving the network structure purposefully can result in better outcomes in community detection. In this study, we have utilized mixed link prediction as a technique to enhance the network structure. Our goal was to eliminate any noise in the network and restore any missed links without altering the number of nodes and edges. We then proceeded to apply various community detection algorithms to compare the quality of the results. To ensure the generality of our approach, we chose the most popular community detection methods (Louvain, Giravan Newman, and Fast Greedy) and link prediction ranking formulas (Common Neighbors, Jaccard Coefficient, Adamic/Adar, Preferential Attachment, and Recourse Allocation) as the core of mixed link prediction. To evaluate the effectiveness of our proposed method, we test it on four different real-world datasets from various domains based on modularity and normalized mutual information measures. Our findings demonstrate that our novel framework for community detection using mixed link prediction improves community detection results in most cases. The success rate also depends on the network properties. Furthermore, this approach has the potential to be extended to stronger community detection and link prediction methods in future researches.
  8. بهبود کیفیت تبدیل سری زمانی به گراف‌ پدیداری نفوذپذیر محدود با ایجاد نسخه وزن‌دار و پیش‌بینی پیوند
    1401
    امروزه تحلیل سر‌ی‌های زمانی از منظر شبکه پیچیده، علاقه بسیاری از پژوهشگران را برانگیخته است. برای تبدیل نوع داده سری زمانی به شبکه (گراف) روش‌های مختلفی وجود دارد که رایج‌ترین آن‌‌ها استفاده از گراف پدیداری است. در یک دسته‌بندی کلی، خانواده الگوریتم‌های گراف پدیداری شامل گراف پدیداری طبیعی(NVG)، افقی(HVG) و نفوذپذیر محدود(LPVG) است که هر یک به اقتضای نیاز پژوهشگر و موضوع مورد پژوهش می‌توانند مفید واقع شوند. گراف‌های پدیداری کاربردهای متعددی در شناخت و کشف ویژگی‌های خاص سری‌های زمانی و حتی پیشگویی مقادیر آتی آن‌ها دارند.‌‌ زمینه‌های انجام پژوهش در این حیطه، تحلیل رفتار سری زمانی، پیش‌بینی رفتار سری زمانی، بهبود کیفیت تبدیل سری زمانی و توسعه مفهوم به گراف‌های پیچیده‌تر است. حاصل اعمال الگوریتم گراف پدیداری بر داده‌های سری زمانی، گرافی ساده است و دقت انجام چنین کاری نیز صد درصد نیست. دراین راستا، گراف پدیداری نفوذپذیر محدود(LPVG)، به عنوان یک نسخه قوی‌تر با مقاومت بیشتر نسبت به نویز ارائه شد. همچنین گراف ساده‌ حاصل از تبدیل، ممکن است منعکس کننده ماهیت اصلی داده‌های سری زمانی نباشد و گراف غنی‌تری از نظر اطلاعات موجود، برای نمایش نیاز باشد. لذا تاکنون نسخه وزن‌دار گراف پدیداری ساده نیز عرضه و کارایی آن به اثبات رسیده است. با توجه به امکان وزن‌دار کردن گراف پدیداری نفوذپذیر محدود که تاکنون انجام نشده است و امکان بهر‌ه‌برداری از روش‌های کاهش نویز در گراف مبتنی بر پیشگویی پیوند، هنوز راه برای بهبود تبدیل داده‌های سری زمانی به گراف پدیداری باز است و افزایش دقت و کیفیت تبدیل، کماکان یک چالش کلیدی محسوب می‌شود. اولین مرحله، تبدیل نوع داده سری‌های زمانی به گراف پدیداری نفوذپذیر محدود(نسخه قوی‌تری از گراف پدیداری طبیعی) است. سپس از سه روش وزن‌دار کردن فاصله اقلیدسی، تانژانت زاویه دید و فاصله زمانی برای ساخت گراف وزن‌دار استفاده شده است. در مرحله بعد با اعمال پیش‌بینی پیوند، سعی در بهبود هرچه بیشتر کیفیت گراف شده است. برای امتیازدهی به ارتباطات در پیش‌بینی پیوند از معیارهای شباهت همسایگان مشترک، اتصال ترجیحی و ضریب جاکارد در نسخه وزن‌دار پیشنهاد و ارزیابی شده است. برای اثبات اعتبار روش پیشنهادی، سه مجموعه داده سری زمانی Taiex، فروش خانه و فروش شامپو اتخاذ شده است که در آن از معیار مبتنی بر پیش‌بینی پیوند AUC برای ارزیابی عملکرد گراف وزن‌دار استفاده می‌شود. نشان داده شده است که در گراف وزن‌دار ساخته شده با روش‌های پیشنهادی و اعمال پیش‌بینی پیوند، مقدار AUC حداکثر تا 0.99376 افزایش می‌یابد و تا حد زیادی بهتر از گراف بدون وزن به دست آمده توسط نظریه گراف پدیداری نفوذپذیر محدود عمل می‌کند.
  9. تحلیل گراف پدیداری داده‌های آموزشی
    1401
    داده‌های سری زمانی آموزش الکترونیک مانند داده‌های جریان کلیک و داده‌های بایگانی اهمیت زیادی در رابطه با کشف الگوی‌های رفتاری دانشجویان آن سامانه‌ها دارد. شناخت و تحلیل این نوع داده‌ها اطلاعات باارزشی در اختیار مدیران سازمان‌های مرتبط می‌گذارد، همانند تشخیص دانشجویان مستعدد ترک تحصیل، شناسایی دانشجویان فعال در پی‌گیری تکالیف علمی، گروه‌بندی دانشجویان براساس شباهت‌های رفتاری، تصمیم‌گیری متناسب با الگوی رفتاری آن‌ها، تشخیص علایق دانش آموزان به یک محتوای آموزشی خاص یا دوره تحصیلی یا یک مدرس خاص براساس فعالیت‌ها و تعاملشان با سامانه و غیره. از طرفی تحلیل گراف پدیداری زمینه‌ای نوظهور در تحلیل شبکه است که تاکنون در زمینه‌هایی مانند پزشکی، اقتصاد، معماری، پردازش تصویر، زمین‌شناسی و برخی زمینه‌های دیگر مطرح شده است که خروجی این بررسی‌ها سبب پیش‌بینی به موقع بیماری‌ها جهت جلوگیری از پیامدهای خطرناک آن‌ها، برآورد بازده بازارهای مالی با برنامه‌ریزی استراتژیک، اصلاح مدل محاسباتی جهت کارایی هزینه‌های بصری و غیره بوده است. همچنین داده‌های سری زمانی آموزش الکترونیک تاکنون در حوزه‌های پژوهشی مانند کشف دانش در سیستم‌های آموزشی، شناسایی الگوهای رفتاری مختلف و پیش‌بینی نتایج آینده و غیره با روش‌های یادگیری ماشین از جمله شبکه عصبی بازگشتی، ماشین بردار پشتیبان و شبکه عصبی مصنوعی مورد تحلیل قرار گرفته‌اند. اما بیشتر پژوهش‌های انجام شده تاکنون بر داده‌های جریان کلیک آموزشی، مبتنی بر روش‌های غیر شبکه‌ای و مرتبط با الگوریتم‌های یادگیری ماشین بوده است. با توجه به اهمیت الگوریتم‌های گراف پدیداری و نقش آن در حیطه تحلیل داده‌های سری زمانی، با نگاشت مناسب آن به حیطه داده‌های آموزشی می‌توان از این پتانسیل بهره برد. هدف این پژوهش توسعه زمینه پژوهشی تحلیل گراف پدیداری به حیله داده‌های آموزشی برای اولین بار است. بدین منظور یک نمونه موردی نیز تعریف و بررسی شده است که عبارت است از تشخیص دانشجویان ضعیف از قوی براساس تحلیل گراف پدیداری داده‌های جریان کلیک سامانه آموزشی براساس معیار‌های تحلیل شبکه مانند مرکزیت درجه، مرکزیت نزدیکی و توزیع درجه و غیره. داده ها از سامانه OULAD که حاوی اطلاعات تعامل کاربران با سامانه آموزشی است، انتخاب شده است. نتایج نشانگر این است که بالاتر بودن مرکزیت درجه، مرکزیت نزدیکی و توزیع درجه در گراف پدیداری حاصل از سری زمانی کلیک دانشجویان، متمایز کننده دانشجو ممتاز از ضعیف و تاییدکننده عدم شباهت رفتاری دانشجویان براساس میانگین کلیک‌هایشان در سامانه است. از طرفی هر سه معیار مذکور با p-valueبسیار پایین نسبت به سایر پارامترها به صورت مشخصی توانستند دانشجویان ممتاز از ضعیف را به درستی تشخیص دهند. میانگین دقت این پارامترها با الگوریتم‌های مختلف یادگیری ماشین با اعتبارسنجی متقاطع ده لایه حاصل شده است. الگوریتم درخت تصمیم با میانگین دقت 78 درصد نسبت به سایر الگوریتم‌ها در تشخیص دانشجویان ممتاز از ضعیف بهتر عمل کرده است.
  10. بهینه سازی رژیم های درمانی تسکینی در بیماران مبتلا به سرطان پوست
    1401
    این پایان‌نامه خواننده را با نحوه استفاده از مدل‌سازی ریاضی برای اطلاع‌رسانی چنین تصمیماتی با مدل‌سازی کامپیوتری و رابطه بین غلظت دارو و اثربخشی این داروها بر روی بیمار آشنا می‌کند. به طور خاص، مدل‌های معادلات دیفرانسیل معمولی مورد بررسی قرار می‌گیرد. با توجه به مشکلات و قید‌های مربوط به درمان سرطان، سعی در ارائه‌ روشه بهینه مناسب برای کنترل بیماران سرطانی دارد. به این منظور، دو مدل مختلف از رشد سلول‌های سرطانی پیشنهاد شده‌است. مدل‎-1‎ برای بیمارانی که فقط از بیماری سرطان رنج می برند و مدل‎-2‎ برای بیمارانی که علاوه بر بیماری سرطان داری مقداری زیادی سلول‌های چربی می‌باشند و دو مشکل اساسی در روش بهینه‌دارو پیشنهادی در نظر گرفته شده ‌است: ‎(1)‎ کاهش هر چه سریع‌تر سلول‌های سرطانی؛ ‎(2)‎ کاهش مقدار داروی تجویز شده برای بیمار. جهت دستیابی به نتایج بهتر به هدف بهینه‌سازی از الگوریتم ‎NSGA-II‎ برای تعامل بین نابود کردن سلول‌های سرطانی و همچنین کاهش استفاده از داروهای بیماری سرطان پیشنهاد شده است. در روش پیشنهادی علاوه بر بهینه‌سازی دارو به بررسی توالی درمان شیمی‌درمانی و پرتودرمانی نیز پرداخته شده‌است. برای مدل‌های ارایه شده دو سناریو مختلف درنظرگرفته شده است. در سناریو‎-1‎ هر دو مدل توالی درمانی رادیوتراپی قبل از شیمی درمانی را مورد بررسی قرار می‌دهد و در سناریو‎-2‎ برای هر دو مدل‌، توالی رادیوتراپی قبل از شیمی‌درمانی تجویز شده است. در ادامه، جهت بهبود عملکرد روش ارائه شده در مقابل نامعینی‌ها و عوامل مرتبط با اغتشاشات همراه با داده‌ها، مقاوم بودن روش پیشنهادی مورد مطالعه قرار گرفته شده‌است. شایان ذکر است که بررسی توالی درمان و بهینه‌سازی دوز تجویز شده با توجه به تنظیم بهینه نامعینی‌های همراه با پارامترها و مقاوم بودن آن در مقابل این نامعینی‌های مربوط به تنوع بین فردی و سایر چالش‌های مدل‌های رشد تومورعملکرد بهتر و مقاومی را از خود نشان داده و نتایج حاصل شده نسبت به روش‌های پیشنهادی دیگر قابل قبول‌تر میباشد. در مقایسه با پژوهش‌های قبلی انجام شده، نوآوری این پایان نامه در ارتباط با بررسی توالی درمانی شیمی‌درمانی و رادیو‌تراپی و بهینه سازی این داروها با توجه به درمان ترکیبی آن‌ها بوده. برای اعتبار سنجی روش پیشنهادی، نتایج به دست آمده با منابع ارجاع داده شده که نتایج بالینی را طی زمان و هزینه زیاد که اخیراً انجام شده است، مقایسه می‌شوند. نتایج حاصل این پژوهش کارایی روش پیشنهادی را تایید می‌نماید.
  11. پیشگویی پیوند ترکیبی وزن دار و کاربردهای آن
    1400
    پیشگویی پیوند یک تکنیک مهم در تحلیل شبکه است. با استفاده از آن می توان وضعیت آینده یال های شبکه را تخمین زد. البته ویرایش های جدیدتر آن می توانند یال های اضافی یا کاذب محتمل را نیز بیابند. اما برخی شبکه ها مانند شبکه بیماری ها، تغییرات همزمان حذف و اضافه را برای تبدیل شدن به مرحله بعدی دارند و نیازمند به پیشگویی پیوند ترکیبی هستند. در رابطه با پیشگویی پیوند صریح ترکیبی، که همزمان یال های اضافه و حذف شونده به شبکه را پیش بینی می کنند، تنها یک پژوهش، آن هم فقط برای گراف ساده انجام شده است. در این پژوهش، برای اولین بار دو الگوریتم پیشگویی پیوند ترکیبی صریح برای شبکه های وزن دار، عرضه شده است. بدین منظور، بخش مربوط به حذف یال ها نیازمند به ایده جدید بود. دو ایده جدید حذف معکوس یال وزن دار و حذف متمم یال وزن دار، برای این کار ارائه شد. علاوه بر آن ایده پیشگویی پیوند افزایشی نیز به همراه پیشگویی پیوند معمول، مورد آزمایش قرار گرفت. همچنین برای ارزیابی کارایی، مقایسه با پیشگویی پیوند بدون وزن از طریق معیار تطابق، بر روی داده های بیماری آلزایمر صورت گرفت. مجموعه داده که از انستیتوی تصویربرداری بیماری آلزایمر (ADNI) تهیه شد، شبکه مغز در چهار مرحله بیماری آلزایمر مشتمل بر سالم، زوال عقلی ملایم آغازین، زوال عقلی ملایم پیشرفته و بیماری آلزایمر (Normal, eMCI, lMCI, AD) است که هر مرحله نسبت به مرحله قبل، شاهد اضافه و کم شدن ارتباطات بین نواحی است. آزمون روش ارائه شده با چهار تابع امتیازدهی همسایگان مشترک (CN)، ضریب جاکارد(JC)، آدامیک/آدار (AA) و الحاق ترجیحی (PA)، انجام شد. برای انتقال از حالت Normal به eMCI، روش JC افزایشی، از حالت eMCI به lMCI روش CN افزایشی، از حالت lMCI به AD روش JC افزایشی و از حالت Normal به AD روش JC افزایشی بهترین عملکرد را داشتند. نتایج به صورت میانگین، نسبت به حالت بدون وزن، هفت درصد بهبود داشت که بیشترین افزایش آن از حالت Normal به eMCI بود. همچنین توالی تغییرات نواحی مغز، ترتیب حذف و اضافه ها، برای استفاده محققین مربوطه استخراج شد. بررسی این تغییرات ممکن است باعث درک بهتر بیماری آلزایمر شود و در کمک به درمان و یا پیشگیری آن موثر باشد. برای بهبود روش پیشنهادی می توان از سایر تابع های امتیازدهی مبتنی بر مسیر یا روش های مبتنی بر شباهت خواص گره ها، تعبیه گری و غیره استفاده کرد. همچنین می توان الگوریتم پیشنهادی را بر انواع شبکه های دارای چند مرحله تغییر حذف و اضافه ارتباطات، مانند شبکه های بیماری های دیگر اعمال کرد.
  12. بهبود انتخاب ویژگی بر پایه گراف با استفاده از پیش گویی پیوند و روش حفره های ساختاری
    1399
    انتخاب ویژگی، یکی از راهکارهای اساسی یادگیری ماشین برای رفع مشکل پردازش داده های با ابعاد بسیار بالا است. بررسی و بکارگیری روش های کارآمدتر انتخاب ویژگی با هدف دستیابی به نتایج بهتر در انتخاب ویژگی، می تواند سبب بهبود و تسریع نتایج کارآیی الگوریتم های مرتبط با یادگیری ماشین شود. در این پژوهش یک روش شش مرحله ای برای بهبود انتخاب ویژگی بدین شرح پیشنهاد می شود. در گام اول، پیش پردازش، مجموعه داده از نظر مقادیر گم شده و تکراری، اصلاح می شود و سپس نرمال سازی می شود. همچنین یکبار امتیاز فیشر را برای همه ی ویژگی ها محاسبه می کنیم و تعداد n-Top ویژگی با بیشترین امتیاز فیشر را حفظ می کنیم و مابقی را حذف می کنیم. در گام دوم با استفاده از ضریب همبستگی پیرسون وابستگی بین رئوس محاسبه می گردد و گرافی وزن دار از ویژگی ها و مقدار وابستگی بین آن ها تشکیل و بازنمایی می گردد و به دلیل عملکرد بهتر الگوریتم خوشه بندی، یال های با مقادیر وزن کمتر از مقدار آستانه بهینه 0.5 از گراف حذف می شوند. در گام سوم برای بهبود ساختار گراف و بازیابی روابط محتمل به اشتباه حذف شده یا از قلم افتاده، با استفاده از الگوریتم های پیش گویی پیوند یال هایی را به گراف اضافه می کنیم. در گام چهارم، با استفاده از الگوریتم تشخیص جامعه لووین بدون ناظر به دلیل سادگی و سرعت اجرای بالا و شناسایی خودکار خوشه ها، جوامع را در گراف ایجاد شده می یابیم. در گام پنجم با استفاده از روش حفره های ساختاری که ارتباطات نهفته بین ویژگی ها را نیز لحاظ می کند، راس های بحرانی و مرکزی تر در هر خوشه شناسایی می شود. در نهایت، در گام ششم، در یک فرآیند تکراری برای هر خوشه، براساس روش گام قبلی، اعضای خوشه رتبه بندی می شوند سپس بصورت نزولی مرتب شده و تعداد w ویژگی ابتدای لیست را انتخاب می کند. اگر تعداد ویژگی هر خوشه کمتر از w باشد آنگاه همه آن ها انتخاب می شوند. به عبارتی دیگر، تعداد w ویژگی در هر خوشه بعنوان نماینده خوشه حفظ کرده و سایر ویژگی ها از خوشه حذف می شوند. در پایان، همه ویژگی های باقی مانده در خوشه ها را به عنوان زیر مجموعه ویژگی های نهایی بهینه گزارش می کنیم. مقایسه نتایج با استفاده از چهار طبقه بند مشهور SVM، KNN، NB و DT حاکی از کارآیی و برتری روش پیشنهادی جدید در مقایسه با روش های اخیر به ویژه در مجموعه داده های با ابعاد بسیار بزرگ و با تعداد نمونه بیشتر است.
  13. انتخاب ویژگی چند برچسبه مبتنی بر اطلاعات متقابل و الگوریتم بهینه سازی کلونی مورچه
    1399
    طبقه بندی داده های چند برچسبه با مسائلی روبه رو است که در آن ها هر نمونه با تعدادی بیشتر از یک برچسب در ارتباط است. امروزه با توجه به پیشرفت رویکردهای دیجیتال، تعداد بسیار زیادی از کاربردهای دنیای واقعی برای داده های چند برچسبه با تعداد ابعاد بالا شکل گرفته اند که سبب کاهش کارایی طبقه بندی می شود. انتخاب ویژگی یک رویکرد موفق و شناخته شده برای کاهش ابعاد داده ها با نگه داشتن ویژگی های مفید و مرتبط و حذف ویژگی های نامربوط یا دارای شباهت به دیگر ویژگی ها است. بسیاری از روش های انتخاب ویژگی که ارائه شده اند از نوع روش های پوششی هستند که از یک طبقه بند چند برچسبه در حین عمل انتخاب ویژگی استفاده می کنند. برای حل این مشکلات، در این پایان نامه دو روش انتخاب ویژگی برای داده های چند برچسبه مبتنی بر اطلاعات متقابل و الگوریتم بهینه سازی کلونی مورچه ارائه شده است. روش پیشنهادی اول ابتدا فضای ویژگی ها را به یک گراف تبدیل می کند که وزن های این گراف بر اساس میزان شباهت ویژگی ها است. سپس الگوریتم بهینه سازی کلونی مورچه به منظور رتبه بندی ویژگی ها اعمال می شود. نوآوری ما در این روش ارائه یک تابع شایستگی جدید و مختص داده های چند برچسبه است که هر دو معیار بیشترین ارتباط با برچسب ها و کمترین میزان شباهت با سایر ویژگی ها را در هر انتخاب در نظر می گیرد و نیز از هیچ مدل یادگیری حین عمل انتخاب ویژگی استفاده نمی کند. روش پیشنهادی دوم بر اساس استراتژی جستجوی روش پیشنهادی اول ارائه شده است. در روش دوم، از رویکردی جدید در ساخت گراف ویژگی ها استفاده می کنیم که بر مبنای ارتباط ویژگی ها با مجموعه برچسب ها می باشد. سپس از یک رویکرد خوشه بندی گراف به منظور دسته بندی ویژگی های مشابه استفاده شده و در نهایت نیز از الگوریتم بهینه سازی کلونی مورچه به منظور رتبه بندی ویژگی ها استفاده می شود. عملکرد روش پیشنهادی اول و دوم را با شش روش جدید و شناخته شده انتخاب ویژگی داده های چند برچسبه بر روی مجموعه داده های چند برچسبه مختلف، مقایسه شده است. همچنین از معیار های ارزیابی متنوع طبقه بندی چند برچسبه و نیز انواع گوناگونی از آزمایش ها در این تحقیق استفاده شده است. نتایج به دست آمده، برتری روش های ارائه شده را در توانایی تشخیص و انتخاب ویژگی های مرتبط و مفید و در نتیجه دقت بالای این روش ها را نشان می دهند.
  14. یک مدل استخراج ویژگی جدید برای تشخیص نفوذ Defacement وب
    1399
    استفاده گسترده از وب سایت ها در فضای سایبری همراه با در دسترس بودن آن ها در دامنه عمومی، حملات سایبری علیه این برنامه ها را افزایش داده است. حمله Defacement که منجر به تغییر شکل ظاهری وب سایت می شود یک حمله معمول باانگیزه های متفاوتی است که برخی از وب سایت های سازمانی را تهدید می کند. در این رساله، برای نظارت بر وب سایت ها در برابر حملهDefacement، یک روش مبتنی بر یادگیری ماشین ارائه شده است. در محتوای وب سایت، تعدادی ویژگی شامل متن، برچسب ها و پیوندها استخراج و بررسی می شود در صورت وجود هرگونه نشانه حمله Defacement، برای ارزیابی ظاهر وب سایت، تصویری از صفحه گرفته می شود و برای تصمیم گیری نهایی از معماری VGG16‎ که مبتنی بر شبکه عصبی کانولوشنی است استفاده می شود. این شبکه با استفاده از تکنیک های انتقال یادگیری و مجموعه داده موجود آموزش داده می شود. نتایج به دست آمده نشان دهنده اثربخشی روش پیشنهادی در تشخیص حمله Defacement با دقت 8/99 درصد است.
  15. ارزیابی امنیت دینامیک سیستم های قدرت در حضور اندازه گیری های ناحیه وسیع با استفاده از روش های یادگیری ماشین
    1398
    به دلیل محدودیت های اقتصادی و ملاحظات زیست محیطی، نقاط کار سیستم های قدرت فعلی در حال نزدیک شدن به مرزهای پایداری هستند. بنابراین حفظ یک سیستم پایدار و مطمئن، موضوعی بسیار مهم و چالش برانگیز است که مورد توجه پژوهشگران و طراحان سیستم قدرت بوده است. پایداری یکی از اهداف اصلی و مهم کنترل عملکرد سیستم قدرت است و ارزیابی سریع و قابل اطمینان آن امری ضروری می باشد. خطر سقوط ولتاژ از مسائل مهمی است که همواره پایداری و امنیت سیستم های قدرت را تهدید می کند و می تواند حتی منجر یه وقوع خاموشی تمام شبکه قدرت شود. در این پایان نامه، سعی برآن شده است که ابتدا مفهوم پایداری ولتاژ کوتاه مدت برروی شبکه نوردیک 74 شینه بررسی شود. لازم به ذکر است که این شبکه در نرم افزار DIgSILENT بطور کامل پیاده سازی گردیده است.مدلسازی بار و تاخیر زمان عملکرد رله های حفاظتی، بیشترین تاثیر را برروی پایداری ولتاژ دارند. ...
  16. ارائه یک راهکار بهینه سازی تکاملی بسیارهدفه با استراتژی انتخاب کارا
    1398
    مسائل بهینه سازی ازجمله مسائل پرکاربرد در انواع سیستم های هوشمند هستند و ازآنجایی که برای حل چنین مسائلی با چند هدف متعارض مواجه هستیم، حل آن ها کاری چالش برانگیز است. به عبارت دیگر، در دنیای واقعی ما اکثراً با مسائلی مواجه هستیم که دارای بیش از یک هدف بوده و برای تصمیم گیری باید به هرکدام از این اهداف توجه شود. تاکنون الگوریتم های بهینه سازی چندهدفه ی متفاوتی برای حل این گونه مسائل طراحی و پیشنهاد شده اند. امروزه با بیشتر شدن تعداد اهداف، مسائل پیچیده تر شده و روش های چندهدفه در مواجهه با آن ها دچار مشکل می شوند. بنابراین، برای حل مسائل با ابعاد بالاتر مدل های موجود نیازمند تغییراتی هستند. بنابر چالش های موجود در این حوزه و پس از بررسی نقاط ضعف و قوت الگوریتم های ارائه شده، در این پایان نامه دو روش برای حل مسائل بهینه سازی چندهدفه و بسیارهدفه پیشنهاد شده است. روش های پیشنهادی تلاش دارند تا در هر مرحله جواب هایی را تولید و انتخاب نماید که ضمن حفظ تنوع، دارای همگرایی خوبی نیز باشند. به منظور طراحی چنین الگوریتم هایی، عملگر انتخاب نسبت به بقیه عملگرها در فرآیند تکاملی از اهمیت بیشتری برخوردار است. برای طراحی یک عملگر انتخاب مناسب، می بایست راهکاری برای ایجاد تعادل بین دو مولفه ی همگرایی و تنوع سنجیده شود : 1) در روش اول از یک استراتژی تجزیه استفاده شده به طوری که مسئله ی چندهدفه را به چند زیر مسئله کوچک تر با استفاده از خوشه بندی مبتنی بر گراف تبدیل می کند. در ادامه، این روش جواب های موجود در هر خوشه را جداگانه بررسی و بهینه سازی می کند. 2) در روش دوم برای طراحی یک مدل بسیارهدفه با الهام از روش اول؛ الگوریتمی پیشنهاد شده که هم زمان با حفظ همگرایی، برای ایجاد تنوع بین جمعیت هر نسل، از یک استراتژی امتیازدهی براساس خوشه بندی حداکثر چگالی استفاده می کند. این الگوریتم با رویکردی مانند رویکرد انتخاب مراکز خوشه ها در روش خوشه بندی حداکثر چگالی، بهترین اعضا برای نسل بعد را از بین اعضای پرچگال به گونه ای انتخاب می کند که نقاطی با بیشترین چگالی محلی و بیشترین فاصله از نقاط پرچگال دیگر به عنوان جمعیت نسل بعد انتخاب شوند.به منظور ارزیابی کارایی روش های پیشنهادی، نتایج حاصل از روش اول با دو مدل بهینه سازی چندهدفه، بر چهار مسئله مورد مقایسه قرار گرفته اند که نتایج، حاکی از برتری روش پیشنهادی اول است. همچنین در آزمایشات متنوعی، روش دوم پیشنهادی با شش مدل بهینه سازی چندهدفه و بسیارهدفه بر دو مجموعه ی گسترده از توابع محک مقایسه گردید که نتایج با استفاده از تحلیل های آماری نشان دهنده ی برتری مدل پیشنهادی دوم هستند.
  17. ارائه یک راهکار بسیارهدفه مبتنی بر الگوریتمهای تکاملی برای تشخیص جوامع
    1397
    ساختار جوامع یکی از خاصیتهای مهم شبکههای پیچیده است که کشف آن نقش عمدهای در درک ساختار توپولوژیکی شبکه داشته و در حوزههای بسیاری از جمله علوم اجتماعی، زیستشناسی و دیگر علوم کاربرد دارد. در سالهای اخیر تشخیص جامعه توجه بسیاری از محققان را به خود جلب کرده است. به طورکلی یک جامعه به مجموعهای از گرههای گراف گفته میشود که ارتباطاتشان با یکدیگر متراکمتر از بقیهی گرههای گراف است. تاکنون روشهای تکاملی بسیاری برای مسئلهی تشخیص جوامع ارائه شدهاند که با چالشهایی مانند ناتوانی در شناخت جوامع با اندازههای مختلف، دقت پایین و نیاز به تعداد واقعی جوامع بهعنوان دانش پیشین روبرو هستند.در این پژوهش دو روش تکاملی مبتنی بر الگوریتم ژنتیک، برای مسئلهی تشخیص جامعه پیشنهاد شده است. تا به حال تشخیص جامعه به عنوان یک مسئله تکهدفه یا چندهدفه در رویکردهای مبتنی بر تکاملی مطرح شده است، ازآنجایی که هر هدف، جنبه ای از ویژگی شبکه را پوشش میدهد، تحقیق در مورد این مسئله با بیش از دو هدف میتواند منجر به یافتن بهترین ساختار جامعه شود. در روش پیشنهادی اول، که بر تشخیص جوامع مجزا تمرکز دارد، مسئلهی تشخیص جامعه به عنوان یک الگوریتم بسیارهدفه فرموله شده و با بهینهسازی هم-زمان چندین هدف سعی در پیدا کردن ساختار دقیقتر جامعه شده است. در روش پیشنهادی دوم، یک الگوریتم تکاملی مبتنی بر مفهوم کلیک برای تشخیص جوامع هم پوشان در شبکه های پیچیده پیشنهاد شده است. نوآوری روش پیشنهادی دوم تغییر بازنمایی مورداستفاده در روش اول است بهگونهای که قابل اعمال بر شبکههای همپوشان نیز باشد. هیچ یک از دو روش پیشنهادی نیازی به دانستن تعداد واقعی جوامع بهعنوان دانش پیشین ندارند.اثربخشی روش پیشنهادی اول با یک الگوریتم تکهدفه و یک الگوریتم چندهدفه بر هردو مجموعه-ی مصنوعی و واقعی مقایسه شده است که نتایج حاکی از آن است که الگوریتم فوق در شبکه های مصنوعی در مجموع 80% موارد و در شبکه های واقعی 75% موارد نسبت به دو روش دیگر برتر بوده است. روش پیشنهادی دوم نیز با سه الگوریتم شناختهشدهی تشخیص جوامع همپوشان مقایسه شده است که نتایج آزمایشات روی شبکههای مختلف، دقت معقول و کارایی مناسب روش دوم را در هر دو شبکهی مصنوعی و واقعی تایید میکند.
  18. مدل سازی شبکه های تنظیمی بیان ژن در برخی از بافت های گاو
    1397
    هدف از این پژوهش استخراج روابط علّی- معلولی بین ژن های متفاوت بیان شده موثر بر صفات مهم گونه گاو شامل ورم پستان، چربی بین عضلانی، سیستم ایمنی و آبستنی با استفاده از داده های ریزآرایهDNA بود. بدین منظور داده های پنج سری آزمایش با شماره های دسترسی GSE75347 (عضله )، GSE24560 (غدد پستانی)، GSE25319 (کبد)، GSE33030 (رحم) و GSE23348 (تخمدان) از پایگاه بیان ژن GEO استخراج شد. پنج درصد ژن هایی که بیشترین میزان واریانس بیان ژنی را داشتند به عنوان ژن های متفاوت بیان شده، شناسایی شدند. برای استخراج روابط علّی- معلولی بین ژن ها از بسته نرم افزاریbnlearn در محیط R استفاده گردید. ژن های مشترک در بین 4 الگوریتم ساختار شناختی (درجه، نزدیکی، بینابینی و دور از مرکز)، به عنوان ژن های هاب در هر بافت و با استفاده از نرم افزار Cytoscape انتخاب شدند. برای تعیین بهترین مدل از روش مدل سازی معادلات ساختاری به دو شیوه تشخیص ارتباط بین ژن های هاب (5 حالت) و بین ژن های هاب و بافت (6 حالت) از معیار AIC و نرم افزار AMOS استفاده شد. در روش ژن محور، در بافت عضله ژن های CBR1 و LOC788826 در بافت غدد پستانی ژن های NID2، COL5A2،LOC616942 وFXYD3 در بافت کبد ژن های LOC100132279،MGC127133 ، MBOAT2،CLDN2 و ANKRD1 در بافت رحم ژن هایDGAT2 ،IGFBP1 ،CKMT1 و ISG15، در بافت تخمدان LOC286871 وINHBA به عنوان ژن های هاب شناسایی شدند. بعد از نگاشت کاوشگرهای هاب به ژن های متناظر در روش کاوشگر محور، در بافت غدد پستانی ژن-های ADAM12، C3، CFB،CHRDL1، NELL2، LOC507402 و JSP.1 در بافت کبد ژن های MICAL2، BOLA-DQB، MCF2،HAO1، FMO5 وJSP.1 ، در بافت رحم ژن های ADAMDEC1، SLC27A6، MAP2، IGFBP1، CFTR، BOLA-DQB و ANPEP در بافت تخمدان ژن های FABP3، FBXO32و HLA-DQA1و در بافت عضله GSTM3 به عنوان ژن های هاب شناسایی شدند. دسته بندی ژن های هاب شناسایی شده نشان داد اطلاعات حاصل از استخراج شبکه به روش ژن محور در مقایسه با روش کاوشگر محور متفاوت است. پس از اعتبار سنجی و تائید ژن های هاب حاصل از این پژوهش در پژوهش های آزمایشگاهی می توان از آن ها به عنوان زیست نشانگر در پژوهش های اصلاح نژاد استفاده کرد. مدل های حاوی اثرات همبستگی بین خطاها به عنوان بهترین حالات مدل سازی ساختاری برای نمایش روابط بین ژن های هاب و روابط بین ژن های هاب و بافت شناخته شد.
  19. سیتم های توصیه گر مبتنی بر اعتماد با استفاده از راهکارهای تجزیه ماتریسی و الگوریتم های فرا ابتکاری
    1397
    سیستم های توصیه گر یکی از موفق ترین ابزارها برای مقابله با سرریز داده ها شناخته می شوند که روزبه روز استفاده از آن ها گسترده تر می شود. این سیستم ها یک نوع ویژه از سیستم های پالایش اطلاعات هستند که آیتم ها را بر اساس جذابیت آن ها برای کاربر از یک مجموعه بزرگ از آیتم ها پالایش می کنند. این سیستم ها سعی دارند، بر اساس عملکرد، سلیقه های شخصی، رفتارهای کاربر و بسته به زمینه ای که در آن مورد استفاده قرار می گیرند به هر کاربر پیشنهادهایی را ارائه دهند که با تمایلات شخصی وی تطابق داشته و کاربر را در فرایند تصمیم گیری یاری نمایند. سیستم های توصیه گر پالایش گروهی یکی از پرکاربردترین و موثرترین روش های توصیه محسوب می شوند که با بررسی انتخاب های کاربران در گذشته، الگوهایی را در داده ها پیدا می کنند که با توجه به آن الگوهای رفتاری برای هر کاربر توصیه مناسب را ارائه می دهند. روش های مبتنی بر پالایش گروهی معمولاً از سه مشکل اصلی رنج می برند که شامل: شروع سرد، پراکندگی داده ها و مقیاس پذیری کم می باشند. در راستای برطرف نمودن چالش های گفته شده، این پایان نامه، دو روش جدید مبتنی بر تجزیه نامنفی ماتریس و اطلاعات اعتماد کاربران در شبکه های اجتماعی، ارائه می شود. چون روش تجزیه نامنفی ماتریس یکی از کاراترین روش های مبتنی بر مدل برای سیستم های توصیه پالایش گروهی است، لذا از اطلاعات اعتماد و عدم اعتماد بین کاربران برای کمک به تجزیه درست و دقیق ماتریس رتبه بندی، استفاده می کنیم تا رتبه های نامشخص برای کاربران و آیتم هایی که شروع سرد دارند با دقت مناسبی پیش بینی شود و در برخورد با داده های پراکنده، بتوان با دقت مناسبی سلیقه کاربر هدف را تخمین زد. همچنین برای افزایش مقیاس پذیری و کاهش پیچیدگی الگوریتم ها از روش های بهینه سازی کارآمد برای حل تابع هدف نهایی استفاده می شود. بعلاوه، سیستم های توصیه گر به دلیل پویا بودن محیط و افزایش سریع اطلاعات، روزبه روز فضای مسئله آن ها بزرگ تر می شود، لذا الگوریتم های دقیق (ریاضی) در حالات مختلفی نمی توانند جواب بهینه را تولید کنند و دنبال کردن جواب دقیق در اکثر مواقع خیلی سخت و پرهزینه است. بعلاوه، در اکثر موارد جواب تقریبی و نزدیک به جواب واقعی، می تواند برای ما رضایت بخش باشد. بنابرین، دو روش پیشنهادی جدید مبتنی بر الگوریتم های فراابتکاری ارائه می شود که
  20. یک راهکار خوشه بندی مبتنی بر چگالی با استفاده از انتشار برچسب پویا
    1396
    خوشه بندی یک رویکرد عمده در زمینه داده کاوی و یادگیری ماشین است و در بسیاری از برنامه های دنیای واقعی موفق بوده است. خوشه بندی حداکثر چگالی یکی از روش های مبتنی بر چگالی است که به تازگی منتشر شده و از کارایی موثری در خوشه بندی اشیا داده برخوردار می باشد. با این حال، این روش خوشه بندی و بسیاری از بهبودهای آن از کاستی هایی رنج می برند. به عنوان مثال، این روش فقط ساختار جهانی داده ها را بررسی می کند که منجر به از دست دادن خوشه های بسیاری می شود. پارامتر برش روی مقادیر چگالی محلی تاثیر مستقیم می گذارد و همچنین می تواند بر کیفیت خوشه بندی تاثیر بگذارد. همچنین راهبرد تخصیص برچسب موجب ایجاد واکنش زنجیره ای می شود. به این صورت که اگر یک نمونه برچسب اشتباه بگیرد،ممکن است نمونه های بیشتری این برچسب اشتباه را بگیرند. یکی دیگر از کاستی های روش خوشه بندی حداکثر چگالی و بهبودهای آن، ناتوانی در تشخیص داده های بسیار پیچیده و دارای چگالی های متنوع می باشد. در این پایان نامه، چهار روش پیشنهادی ارائه شده است. که دو روش اول و دوم رویکردی بدون تکرار و روش سوم وچهارم رویکرد تکراری مبتنی بر گراف را ارائه می دهند. در روش اول از چگالی محلی مبتنی بر همسایگی بهره برده شده است. همچنین برای جلوگیری از تخصیص برچسب اشتباه به نمونه ها، روش مبتنی بر رای گیری بین نمونه ها ارائه خواهد شد. در روش پیشنهادی دوم از یک رابطه همسایگی نرم برای محاسبه چگالی محلی نمونه ها و ایجاد ساختار اولیه خوشه ها استفاده خواهد شد. همچنین نواحی هم پوشان ، نمونه های مرزی و نمونه های نویز در این روش شناسایی خواهند شد. در روش پیشنهادی سوم علاوه بر استفاده از چگالی محلی مبتنی بر همسایگی، برای خوشه ها ساختار محلی و ستون فقرات ایجاد می شود. بعد یک روش انتشار برچسب پویای مبتنی بر گراف را برای انتشار مناسب برچسب ها به کار می برد، که تا حد زیادی از انتشار برچسب اشتباه به نمونه ها جلوگیری می کند. روش پیشنهادی چهارم توسعه یافته روش پیشنهادی سوم است، با این تفاوت که مشکل انتخاب مرکز خوشه در مجموعه داده هایی با تنوع چگالی را در نظر خواهد گرفت و راهبرد ایجاد ریزخوشه و ادغام مبتنی بر الگوریتم های سلسله مراتبی را برای حل آن به کار خواهد برد. آزمایش های متعددی برای ارزیابی عملکرد روش های پیشنهادی در هر دو مجموعه داده های مصنوعی و داده های
  21. یک راهکار یادگیری نیمه نظارتی مبتنی بر گراف برای طبقه بندی چندبرچسبه
    1396
    مسائل چندبرچسبه در حوزه های مختلف از جمله طبقه بندی خودکار داده های چندرسانه ای به وجود آمده اند و در زمینه بینایی ماشین و یادگیری ماشین مورد توجه قرارگرفته اند. اما روش های موجود به دو چالش اصلی، استخراج وابستگی بین برچسب ها و کمبود داده های برچسب گذاری شده و حتی برچسب های از دست رفته نمی پردازند، درحالی که استخراج همبستگی برچسب ها برای یادگیری چندبرچسبه بسیار مهم است. همچنین رویکردهای فعلی معمولاً با فرض اینکه همبستگی برچسب ها در همه موارد به اشتراک گذاشته شده است از همبستگی های برچسب سراسری استفاده می کنند. لذا در این پژوهش، مدل نیمه نظارتی تجزیه مبتنی بر همبستگی محلی، برای پوشش چالش های ذکر شده پیشنهاد شده است که اجازه می دهد همبستگی برچسب ها به صورت محلی مورد استفاده قرار داد. این مدل به صراحت پایه کمکی را برای یادگیری زیر فضای معنایی معرفی می کند و توانایی های تفکیک کنندگی آن را با استفاده از نمونه های برچسب دار و بدون برچسب تقویت می کند. به عبارت دیگر، برچسب نمونه های برچسب دار را به نمونه های بدون برچسب منتقل می کند. این روش پیشنهادی می تواند به طور موثر با مجموعه های مقیاس بزرگ مقابله و همبستگی برچسب ها را استخراج کند و پیش بینی های امیدوار کننده و بهتری نسبت به روش های نوین بدست آورد.
  22. یک راهکار در سیستم های توصیه گر مبتنی بر تجزیه ماتریس واعتماد
    1396
    رشد روز افزون اطلاعات کاربران را ملزم به صرف هزینه و زمان زیادی برای پیدا کردن گزینه های موردعلاقه خود کرده است. از این رو برای کمک به انتخاب بهترین گزینه ممکن از میان حجم وسیع اطلاعات، سیستم های توصیه گر ظهور کردند. سیستم های توصیه گر درکاربردهای زیادی از قبیل تجاری، پژوهشی، پزشکی وگردشگری استفاده قرار می گیرند. یکی از مشهورترین سیستم های توصیه گر، سیستم های پالایش گروهی هستند که بر اساس شباهت رتبه دهی کاربران عمل می کنند. در سیستم های پالایش گروهی بکارگیری اطلاعات اجتماعی و به عبارت دیگر، اطلاعات مربوط به دوستان کاربر که به عنوان اطلاعات اعتماد شناخته می شوند، می توانند جهت ارائه توصیه های دقیق تر به کاربران مورد استفاده قرار گیرند. تجزیه ماتریس یکی از روش-های مبتنی بر مدل در سیستم های پالایش گروهی است. به علت تنکی داده ها برآورد دقیق مقادیر رتبه دهی های نامعلوم برای روش-های فعلی کار دشواری است. در این پایان نامه چهار روش جدید به منظور بهبود کارایی سیستم های توصیه گر مبتنی بر تجزیه ماتریس معرفی شده است. روش پیشنهادی اول با کاهش واریانس و به کارگیری خوشه بندی سبب بهبود تنوع و دقت در ارائه ی توصیه ها گردیده است. در روش پیشنهادی دوم ماتریس های فاکتور نهان کاربر و آیتم با روش تجزیه مقادیر منفرد برای مقداردهی شده اند که تنکی داده ها و مقیاس پذیری الگوریتم را پوشش داده است. روش پیشنهادی سوم با استفاده از شباهت کاربران مورد اعتماد، روش پیشنهادی دوم را بهبود داده است. در روش پیشنهادی چهارم با تعریف مفهوم درجه اعتماد در سیستم های توصیه گر مبتنی بر اعتماد،کارایی سیستم در بهبود دقت پیش بینی افزایش یافته است.
  23. شناسایی جوامع با استفاده از راهکار انتشار برچسب مبتنی بر زیرفضا در شبکه های پیچیده
    1396
    بسیاری از سیستم های دنیای واقعی مانند شبکه های اجتماعی و بیوانفورماتیک به صورت شبکه های پیچیده بیان شده که تحلیل آن ها توجه زیادی را به خود جلب کرده است. یکی از آشکارترین ویژگی های آن ها، وجود جوامع در آن ها است که از ارزش ویژه ای در علوم اجتماعی، زیست شناسی و شاخه های دیگر علوم برخوردار هستند و شناسایی آن ها، سبب استخراج اطلاعات سودمندی در مورد اعضای شبکه و ارتباطات بین آن ها شده و به درک ساختار شبکه کمک می کند. امروزه روش های زیادی برای شناسایی جوامع مطرح شده اند، اما این روش ها با کاستی هایی همچون عدم پایداری، ناتوانی در شناسایی جوامع کوچک، نیاز به اطلاع از تعداد جوامع و دقت پایین در شناسایی جوامع در شبکه های با ساختار ناواضح مواجه هستند. در این پژوهش، سه روش جدید برای شناسایی جوامع برای غلبه بر این کاستی ها مطرح شده اند. در روش پیشنهادی اول، هر جامعه به صورت یک تراکم محلی از گره های مشابه در فضای شباهت ها در نظر گرفته می شود. این روش شامل سه مرحله است. در ابتدا شبکه با استفاده از کدگذاری خطی خلوت به یک فضای شباهت با ابعاد کم انتقال می یابد. ایده اصلی در نگاشت شبکه این است که هر داده می تواند به صورت یک ترکیب خطی از گره های زیرفضایی خود نشان داده شود. سپس، یک روش جدید رتبه دهی گره، به منظور تعیین مرکزیت گره ها ارائه می گردد. و در نهایت، یک روش انتشار برچسب مبتنی بر اشتراک زیرفضایی برای شناسایی جوامع نهایی مطرح می شود. این روش انتشار برچسب سعی در یافتن جوامعی با تراکم بالای شباهت درون جامعه ای با استفاده از اطلاعات سراسری در شبکه دارد. در روش پیشنهادی دوم، زیرفضای گره ها و مراکز جوامع مشابه با روش پیشنهادی اول شناسایی می شوند. سپس، با ترکیب اطلاعات محلی و سراسری، یک روش انتشار برچسب با هدف شناسایی جوامعی با تراکم بالای شباهت درون جوامع و هم چنین شباهت کم بین آن ها ارائه می گردد؛ در روش پیشنهادی سوم، یک مدل مبتنی بر تجریه ی نامنفی ماتریس با استفاده از اطلاعات محلی، سراسری، ساختاری و قطعی ارائه می گردد. اطلاعات سراسری شبکه مانند، مراکز جوامع، و اطلاعات زیرفضایی گره ها مشابه روش پیشنهادی اول شناسایی می شوند.سپس، ریزجوامع در اطراف مراکز شکل می گیرند. ریزجوامع به منظور شناسایی یال های مثبت و منفی به عنوان اطلاعات قطعی در مدل مورد استفاده قرار می گیرند. هم چنین در این م
  24. یک راهکار ترکیبی برای خوشه بندی مستندات متنی با استفاده از الگوریتم های کاهش بعد
    1395
    با رشد روزافزون مستندات متنی، انتخاب اطلاعات مطلوب در زمان محدود کار دشواری است. با استفاده از ابزارهایی نظیر خوشه بندی، می توان این حجم انبوه اطلاعات را مدیریت نمود. خوشه بندی فرآیندی است که در آن مجموعه ای از نمونه داده ها به گروه های مجزایی از خوشه ها تقسیم می شوند. به طوری که، نمونه های یک خوشه تا حد امکان به یکدیگر شبیه بوده و با نمونه های دیگر خوشه ها، متفاوت باشند. خوشه بندی در زمینه های بسیاری از جمله شناسایی الگو، یادگیری ماشین، داده کاوی و بازیابی اطلاعات کاربرد دارد. در این پایان نامه، چهار روش جدید خوشه بندی برای مستندات متنی ارائه شده است که در این روش ها به منظور انتخاب زیرمجموعه ی موثری از ویژگی ها، از روش کاهش بعد پراکندگی داده استفاده می شود. در روش پیشنهادی اول، یک تابع هدف جدید مبتنی بر خوشه بندی فازی به همراه آنتروپی وزن ویژگی ها ارائه شده است. وزن دهی در این روش به صورت سراسری است. از جمله مزیت های این روش می توان به بروزرسانی وزن ویژگی ها در طی فرآیند خوشه بندی و مقابله با نویز اشاره کرد. از آنجایی که در مسائل واقعی جهان، وزن هر ویژگی در خوشه های مختلف، متفاوت است، در دو روش پیشنهادی دوم و سوم، وزن دهی ویژگی ها به صورت محلی انجام می شود. لازم به ذکر است که تفاوت روش پیشنهادی دوم و سوم در معیار شباهتشان می باشد. در روش پیشنهادی سوم از معیار شباهت غیراقلیدسی استفاده می شود. این امر باعث می شود، در مواقعی که نویز بیش از اندازه وجود دارد، خوشه بندی با دقت بهتری انجام شود. در روش پیشنهادی چهارم از ترکیب الگوریتم زنبور عسل و وزن دهی سراسری استفاده شده است. بدین ترتیب، علاوه بر این که از مزایای الگوریتم های هوش جمعی بهره می برد، با وزن دهی ویژگی ها دقت خوشه بندی نیز بهبود پیدا می کند. عملکرد روش های پیشنهادی در مجموعه داده های عددی و متنی مورد ارزیابی قرار گرفته است. در این ارزیابی، عملکرد روش های پیشنهادی با 9 روش خوشه بندی شناخته شده و بر اساس معیارهای ارزیابی مختلف بررسی شده است. نتایج آزمایشات، کارایی روش های پیشنهادی و بهبود روش های خوشه بندی قبلی را نشان می دهند.
  25. یک راهکار ترکیبی بدون ناظر برای انتخاب ویژگی در متن با استفاده از الگوریتم های بهینه سازی مبتنی بر جمعیت
    1395
    با پیشرفت روزافزون فناوری اینترنت، تعداد اسناد الکترونیکی به طور چشم گیری افزایش یافته است. دسته بندی متن، نقش مهمی برای مقابله با این حجم عظیم از داده ها را دارد. یکی از مشکلات دسته بندی متن، ابعاد بالای فضای ویژگی است. در مجموعه های داده ای با ابعاد بالا، بسیاری از ویژگی ها، نامناسب و دارای افزونگی می باشند و می توانند تاثیر منفی بر روی عملکرد سیستم طبقه بندی داشته باشند. انتخاب ویژگی یک راهکارمهم برای غلبه بر این مشکل است که هدف آن، انتخاب زیرمجموعه ای از ویژگی های مناسب از بین مجموعه ویژگی های اولیه است. از این رو، راهکار انتخاب ویژگی با کاهش ابعاد مسئله، سبب کاهش پیچیدگی محاسباتی و افزایش قابلیت تعمیم الگوریتم طبقه بندی می شود. در این پایان نامه، سه روش انتخاب ویژگی جدید ارائه می شود. در روش پیشنهادی اول، بر انتخاب ویژگی با استفاده از مفهوم کمترین افزونگی بین ویژگی ها و بیشترین ارتباط با کلاس هدف در دسته بندی متن تمرکز دارد. در این روش، ویژگی های نامناسب و دارای افزونگی به طور موثر حذف می شوند، اما به دلیل انتخاب حریصانه ویژگی ها در فرآیند انتخاب ویژگی راه حل های محلی تولید می کند. با در نظر گرفتن این ضعف، در راهکار پیشنهادی دوم، یک الگوریتم چند هدفه مبتنی بر اطلاعات متقابل با هدف کاهش افزونگی بین ویژگی ها و افزایش ارتباط با کلاس ارائه شده است. روش پیشنهادی سوم براساس روش پیشنهادی اول ارائه شده است. در روش پیشنهادی سوم، با به کار بردن معیار های ارتباط و افزونگی روش اول در یک الگوریتم تکاملی چندهدفه، سعی در انتخاب بهترین ویژگی ها دارد. مزیت عمده روش های پیشنهادی دوم و سوم، استفاده از الگوریتم های تکاملی چند هدفه در فرآیند انتخاب ویژگی می باشد. عملکرد روش های پیشنهادی با چندین روش انتخاب ویژگی، بر روی طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات کارایی روش های پیشنهادی و بهبود روش های انتخاب ویژگی قبلی را نشان می دهد.
  26. یک راهکار برای تشخیص جامعه در شبکه های پیچیده بر اساس روش های چند هدفه مبتنی بر جمعیت
    1395
    بسیاری از سیستم های واقع در جهان مانند شبکه های اجتماعی انسانی، شبکه های حمل ونقل، و اینترنت، به وسیله ی شبکه های پیچیده نمایش داده می شوند. این شبکه ها ویژگی های مهمی دارند. یکی از این ویژگی ها که توجه خاصی را به خود جلب کرده، ساختار جامعه است. در سال های اخیر، تلاش های تحقیقاتی به سمت شناسایی ساختار جوامع شبکه های پیچیده، افزایش یافته است. کشف ساختار جامعه، نقش عمده ای در درک ساختار توپولوژیکی شبکه دارد. این مسئله می تواند به استخراج اطلاعات مهم از شبکه، کمک کند. در این پایان نامه، دو روش جدید تشخیص جامعه ی ، مبتنی بر تغییریافته ی الگوریتم بهینه سازی ازدحام ذرات ارائه می شود. در روش اول، ابتدا مجموعه ای از راه حل های تصادفی تولید می شود. سپس راه حل ها در فضای جستجوی مسئله، با هدف بهینه کردن یک تابع کیفیت مناسب، حرکت می کنند. نوآوری ما در الگوریتم بهینه سازی ازدحام ذرات، تغییر استراتژی حرکت راه حل هاست. روش پیشنهادی دوم بر اساس استراتژی جستجوی روش پیشنهادی اول، ارائه شده است. در روش دوم، مفهوم بهینه سازی چندهدفه را به کار می بریم، که در آن دو تابع هدف مناسب انتخاب می-شود. سپس با استفاده از یک روش مناسب، به حل مسئله ی بهینه سازی چندهدفه می پردازیم. عملکرد روش پیشنهادی اول، با سه روش تشخیص جامعه ی دیگر مقایسه شده است. نتایج آزمایشات بر روی مجموعه داده های مصنوعی و واقعی، بهبود چشمگیری را ازنظر سرعت همگرایی و ماژولاریتی، در مقایسه با سه روش دیگر نشان می دهد. روش پیشنهادی دوم را با شش روش شناخته شده ی دیگر مقایسه کرده ایم. نتایج آزمایشات روی شبکه های مختلف، دقت بالای روش دوم را در شناسایی جوامع واقعی این شبکه ها تایید می کند.
  27. یک راهکار توصیه گر مبتنی بر زمان با استفاده از الگوریتم-های شبکه های اجتماعی
    1395
    یکی از مسائل مهم دنیای مدرن امروز، فراوانی اطلاعات است. از این رو برای کمک به انتخاب بهترین گزینه ممکن از میان حجم وسیع اطلاعات، سیستم های توصیه گر ظهور کردند. در سال های اخیر استفاده از سیستم های توصیه گر بسیار متداول شده است. چالش های موجود در دادگان این سیستم ها، تحقیق را برای ارائه الگوریتم های با دقت پیشنهادی بالا جذاب کرده است. این نوع سیستم ها بر اساس سلیقه کاربر عمل می کنند. البته این حقیقت باید در نظر گرفته شود که سلیقه کاربر در طی زمان به طور مداوم تغییر می کند. به علاوه مدل کردن سلیقه کاربر به صورت پویا یک چالش بزرگ برای ارائه توصیه های شخصی سازی شده به کاربر است. در سیستم های پالایش گروهی بکارگیری اطلاعات اجتماعی و به عبارت دیگر، اطلاعات مربوط به دوستان کاربر که به عنوان اطلاعات اعتماد شناخته می شوند، می توانند جهت ارائه توصیه های دقیق تر به کاربران مورد استفاده قرار گیرند. در واقع، اساس سیستم های توصیه گر مبتنی بر اعتماد، جستجوی افراد مورد اعتماد است. در نتیجه، استفاده از اطلاعات اجتماعی و در نظر گرفتن تغییر سلیقه کاربران در طی زمان دقت و کیفیت سیستم های توصیه گر را بهبود خواهد داد. در این پایان نامه دو روش جدید به منظور بهبود کارایی سیستم های توصیه گر مبتنی بر زمان معرفی شده است. در واقع، با استفاده از اطلاعات اجتماعی، علاوه بر رفع ضعف های مربوط به سیستم های پالایش گروهی، میزان دقت و پوشش بهبود پیدا کرده است. برای این منظور، در روش پیشنهادی اول، با استفاده از تشخیص جوامع هم پوشان و استخراج قوانین انجمنی، کاربران هم سلیقه با کاربر هدف شناسایی شده و بر اساس آن فرآیند توصیه صورت می پذیرد. علاوه بر این، در روش پیشنهادی دوم، با ترکیب مفهوم اعتماد، زمان و شباهت در سیستم های توصیه گر، کارایی این سیستم ها در بهبود خطا و پوشش بر روی کاربران و آیتم ها افزایش یافته است.
  28. سیستم شناسایی پلاک ماشین با استفاده از تصاویر دید گسترده
    1394
    در طبیعت انواع مختلفی از بینایی دید گسترده در برخی از موجودات تکامل یافته است.ویژگی ها و قابلیت های این نوع از بینایی و ویژگی هایی از جمله کاهش هزینه تجهیزات ویدیویی برای پوشش یک منطقه در کنار افزایش قدرت پردازش رایانه ها موجب شده است که این موضوع در بینایی ماشین مورد توجه قرار گیرد.جذابیت ها و توانایی های منحصر به فرد این نوع از بینایی باعث شده که محققین زیادی در این زمینه فعالیت کرده و هر کدام به جنبه های خاصی از آن بپردازند. هدف اصلی این پایان نامه طراحی و ساخت یک سیستم تصویر برداری با پوشش فضای زاویه ای 360 درجه ای محیط می باشد.به همین منظور از یک سیستم تصویر برداری کاتادیوپتریک متشکل از یک دوربین و آینه هذلولی برای ایجاد تصویر دید گسترده استفاده شده است.همچنین برای نمایش بعضی از خصوصیت های کاربردی این سیستم بینایی،دو موضوع تشخیص پلاک و تشخیص صورت در تصاویر دید گسترده مورد بررسی قرار گرفته است
  29. ارائه ی یک روش توصیه گر برای سیستم های IPTV جهت بهبود کیفیت خدمات
    1394
    چکیده امروزه، تلویزیون یک رسانه محبوب و پرکاربرد است. با گسترش و پیشرفت علم، تلویزیون نیز تغییراتی را در خود مشاهده کرده است. از جمله این تغییرات، بهبود در اندازه، کیفیت و افزایش تعداد کانال ها است. علیرغم همه این پیشرفت ها، تلویزیون تنها رسانه ای بود که، همچنان یکطرفه باقی ماند و تنها ارتباط از سمت سرویس دهندگان به سمت سرویس گیرندگان، بود. کاربران تلویزیون، متمایل بودند همانند سرویس های اینترنتی، امکان تعامل با تلویزیون را داشته باشند. به همین دلیل، تلویزیون وارد دنیای جدیدی شد و توانست با استفاده از سرویس های اینترنتی، سیستمی جدید را به وجود آورد. این سیستم که IPTV، نامیده می شود، امکان ارتباط دو طرفه بین کاربر و تلویزیون را فراهم آورد. در این بین، تعداد و تنوع محتوای ارائه شده توسط تلویزیون نیز، افزایش یافت و همین امر سبب به وجود آمدن مشکلاتی برای کاربران شد. تعداد زیاد کانال ها باعث می شد که کاربر در انتخاب و پیدا کردن محتوای مورد علاقه خود، به مشکل برخورده و زمان زیادی را صرف این کار کند. جهت مقابله با این مشکل، سیستم های توصیه گر پیشنهاد شدند. در سیستم های توصیه گر، با استفاده از رفتار کاربر در گذشته و آیتم هایی که مشاهده کرده است، علاقیات کاربر را تشخیص داده و بر اساس علاقیات آن، کانال هایی را به آن، توصیه می کنیم. برای توصیه آیتم به کاربر فعال، با استفاده از تکنیک خوشه بندی ابتدا، کاربران را در گرو هایی مشابه، قرار داده و سپس با توجه به رفتار کابران موجود در گروهی که کاربر فعال به آن تعلق دارد، آیتم هایی را برای توصیه، انتخاب کردیم. تعداد کاربران موجود در یک گروه، زیاد است، به همین دلیل با استفاده از معیار پیرسون، ما کاربرانی را انتخاب کردیم که دارای تشابه بیشتری با کاربر فعال بودند. بعد از بررسی رفتار کاربر مشابه به کاربر فعال، با تکنیک رتبه بندی، آیتم های منتخب را، رتبه دهی کرده و در نهایت به کاربر پیشنهاد کردیم. در روش دوم، علاوه بر در نظر گرفتن معیار ییرسون، جهت انتخاب کاربران مشابه، از روابط دوستی بین کاربران نیز، استفاده شد. نتایج نشان داد که استفاده از معیار پیرسون و روابط دوستی بین کاربران، سیستم را به کارائی بالاتری می رساند.
  30. نشانه گذاری بلاکی ویدیویی شفاف، مقاوم به نرخ تغییر قاب وحملات هندسی
    1394
    در دهه های اخیر با پیشرفت سریع تکنولوژی اطلاعات وگسترش شبکه اینترنت، امکان استفاده یا تغییر غیرمجاز داده ها مانند کپی و یا جعل با سرعت قابل توجهی افزایش یافته است. درهمین راستا، این امکان باعث شده است که مسئله امنیت و حفاظت اطلاعات به صورت جدی تری مطرح و پیگیری گردد. راه حل های مختلفی برای حل این چالش ارائه گردیده است. یکی از روش های موثر درحل این مسئله، نشانه گذاری می باشد. نشانه گذاری به فرآیند درج یا تعبیه یک نشانه (متن، صدا، تصویر وغیره) در داخل داده میزبان گفته می شود و برای کاربردهایی مانند اثبات مالکیت، شناسایی صاحب اثر، کنترل کپی، تعیین اعتبار محتوی و بایگانی به کار برده می شود. در این پایان نامه، چند الگوریتم برای نشانه گذاری داده های ویدیویی در حوزه مکان و تبدیل ارائه شد است. برخلاف الگوریتم های رایج که نشانه به صورت مستقیم در داده میزبان درج می شود، در الگوریتم های اول و دوم پیشنهادی که جزء روش های نشانه گذاری نیمه کور هستند، از تولید تصویر رمزشده برای درج و استخراج نشانه استفاده می شود. در الگوریتم پیشنهادی اول، ابتدا توسط یک روش بهینه سازی فریم هایی که مناسب هستند انتخاب می شوند. سپس ، در هرفریم مناطقی که مستعد نشانه گذاری هستند و مقاومت بالایی در مقابل حملات مختلف دارند انتخاب می شوند. با این روش الگئریتم به مقاومت بالایی دست می یابد. در همین راستا، به بلاک تفسیم بندی و نهایتا طبقه بندی می شوند. تصویر رمزشده از طریق نوع بلاک و نوع بیت نشانه (0 یا 1) تولید شده و در مرحله استخراج به کمک این تصویر و نوع بلاک نشانه بازسازی خواهد شد. در الگوریتم دوم ضعف الگوریتم اول مرتفع می گردد. الگوریتم دوم در واقع همان روش اول است اما آن را بهبود داده به گونه ای که روش پیشنهادی می تواند در مقابل حملات هندسی نظیر چرخش و برش مقاومت بالایی داشته باشد. در این روش با محاسبه میزان تغییر دستگاه مختصات سعی در جبران آن نموده یعنی تغییرات معکوس می شوند تا سیستم به حالت اولیه برسد سپس نشانه استخراج می شود. این راهکار پیشنهادی باعث می شود که با وجود حملات شدید هندسی نشانه با جزئیات بیشتری بازسازی شود. این روش پیشنهاد شده می تواند تاثیر بسزایی درمقاومت روش های که از بلاک بندی استفاده می کنند، داشته باشد. در الگوریتم سوم، از یک روش نیمه کور دیگر بهره می گیریم که در آن نشانه برخلاف دو
  31. ارایه یک روش ابتکاری برای حل مساله ی جدول زمان بندی دروس دانشگاهی با استفاده از الگوریتم های مبتنی بر جمعیت
    1394
    مساله ی جدول زمان بندی دروس یکی از موضوعات مهم پیش رو در دانشگاه ها و موسسات آموزش عالی سر تا سر جهان است. این مساله که از دسته ی مسائل NP-hard به شمار می رود، شامل برنامه ریزی تعداد مشخصی از درس ها در بازه های زمانی و کلاس های درسی است به نحوی که تداخلی میان آن ها پیش نیاید. روش ارایه شده در این رساله عبارت است از یک الگوریتم پیشنهادی مبتنی بر گروه بندی ژنتیک و الگوریتم زنبور عسل که ساختارهای همسایگی ابتکاری در آن تعبیه شده است. راه حل ارایه شده بر روی مجموعه داده ایی Socha آزمایش شده که یکی از استاندارد و معتبرترین مجموعه داده های موجود در مساله ی جدول زمان بندی است. این مجموعه شامل 5 نمونه کوچک، پنج نمونه متوسط و یک نمونه با اندازه بزرگ است. مساله ی جدول زمان بندی دروس دانشگاهی شامل 6 محدودیت است که نیمی از آن ها محدودیت های سخت و نیمی از آن محدودیت نرم است. مهم ترین محدودیت ها، محدودیت های سخت هستند که در صورت نقض هر کدام از آن ها، راه حل امکان پذیر به دست نمی آید. به عنوان مثال، یک دانشجو نمی تواند هم زمان در دو کلاس درسی شرکت کند. حذف محدودیت های نرم، اجباری نیست اما حذف هرچه بیشتر آن ها باعث ارتقای راه حل می شود. تا کنون هیچ یک از راه حل های ارایه شده در این حوزه نتوانسته است تعداد محدودیت های نرم بر روی نمونه های متوسط و بزرگ در این مجموعه داده ایی را به صفر برساند. در ساختار ابتکاری این رساله از یک رویکرد دو مرحله ایی برای حل مساله ی جدول زمان بندی استفاده شده است. در مرحله ی اول از یک الگوریتم پیشنهادی مبتنی بر گروه بندی ژنتیکی، برای به دست آوردن یک راه حل امکان پذیر استفاده شده است. در فاز دوم یک الگوریتم مبتنی بر ساختار زنبور عسل برای ارتقای کیفیت راه حل ها به کار برده شده است و در آن یک ساختار همسایگی تعبیه شده است که پاسخ های موثرتری را به وجود می آورد.
  32. ارائه راهکارهای مبتنی بر خوشه بندی گراف برای انتخاب ویژگی
    1393
    با پیشرفت های به وجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی دهه های اخیر مجموعه های داده ای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتم های طبقه بندی می شوند. ازاین رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارای الگوریتم های طبقه بندی پیشنهادشده است. انتخاب ویژگی از دو جهت سبب بهبود الگوریتم طبقه بندی می شوند. ازیک طرف با کاهش ابعاد مسئله پیچیدگی محاسباتی کاهش پیدا می کند و از طرف دیگر، قابلیت تعمیم الگوریتم یادگیری افزایش پیدا می کند و احتمال بیش برازش کاهش می یابد. در این پایان نامه سه روش انتخاب ویژگی با استفاده از خوشه بندی گراف ارائه می شود. درروش پیشنهادی اول، در ابتدا با استفاده از یک الگوریتم تشخیص جوامع ویژگی های اولیه به تعدادی خوشه، دسته بندی می شوند. سپس، با به کارگیری الگوریتم ژنتیک و با استفاده از الگوریتم طبقه بندی KNN یک روش انتخاب ویژگی مبتنی بر راهکار پوششی ارائه می شود. در این روش، ویژگی های نامرتبط و دارای افزونگی به طور موثر حذف می شوند اما به دلیل استفاده از الگوریتم طبقه بندی در طی فرآیند انتخاب ویژگی این روش دارای پیچیدگی محاسباتی بالایی برای مجموعه های داده ای با ابعاد بالا است. با در نظر گرفتن این ضعف، درروش پیشنهادی دوم با استفاده از الگوریتم بهینه سازی کلونی مورچه ها یک روش مبتنی بر راهکار فیلتر راهکار فیلتر ارائه شده است که باوجود کاهش پیچیدگی محاسباتی، کیفیت ویژگی های انتخاب شده همچنان حفظ شده است. درنهایت درروش پیشنهادی سوم با ترکیب دو تکنیک خوشه بندی گراف و مرکزیت گره یک روش انتخاب ویژگی مبتنی بر راهکار فیلتر ارائه شده است که می تواند در هر دو حالت بدون ناظر و با ناظر ویژگی های نهایی را انتخاب کند. عملکرد روش های پیشنهادی با شناخته شده ترین و جدیدترین روش های انتخاب ویژگی، بر روی طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایش ها نشان داد که روش های پیشنهادی هم از نظر زمان اجرا و هم از نظر دقت طبقه بندی دارای عملکرد مناسب هستند.
  33. ارائه سیستم های توصیه گر مبتنی بر مفاهیم تسلط پارتو و اعتماد در شبکه های اجتماعی
    1393
    حجم زیاد اطلاعات آنلاین منجر به این شده تا کاربران انرژی و زمان زیادی را صرف پیدا کردن محصولات مورد علاقه خود کنند. با این حال، آنها در اکثر موارد قادر به دریافت نتایج رضایت بخشی نیستند. سیستم های توسیه گر اخیراً در کاربردهای زیادی از جمله، توصیه کتابها در سایت آمازون، ویدئو در یوتیوب و ارائه نتایج در صفحات وب مورد استفاده قرار گرفته اند. در این بین سیستم های پالایش گروهی، شهرت بسیاری را در سیستم های توصیه گر دارا بوده و برای ارائه توصیه به کاربران از آیتم هایی که قبلاً توسط کاربرانی مشابه رتبه داده شده اند استفاده می کنند. بکارگیری اطلاعات اجتماعی و به عبارت دیگر، اطلاعات مربوط به دوستان کاربر که به عنوان اطلاعات اعتماد شناخته می شوند، می توانند در سیستم های پالایش گروهی به عنوان اطلاعات اضافی جهت ارائه توصیه های دقیق تر به کاربران مورد استفاده قرار گیرد. در واقع اساس سیستم های توصیه گر مبتنی بر اعتماد، جستجوی افراد مورد اعتماد با توجه به انتشار اعتماد در شبکه اعتماد می باشد. در نتیجه، استفاده از اطلاعات اجتماعی و در نظر گرفتن شبکه اعتماد ایجاد شده توسط کاربران دقت و کیفیت سیستم های توصیه گر را بهبود خواهد داد. در این پایان نامه دو روش جدید به منظور بهبود کارایی سیستم های توصیه گر مبتنی بر اعتماد معرفی شده است. در واقع با استفاده از اطلاعات اجتماعی، علاوه بر رفع ضعف های مربوط به سیستم های پالایش گروهی، میزان دقت و پوشش بهبود پیدا کرده است. برای این منظور در روش پیشنهادی اول، از مفهوم تسلط پارتو به منظور بررسی میزان تاثیر کاربران مورد اعتماد در سیستم های توصیه گر مبتنی بر اعتماد استفاده شده و میزان دقت در این سیستم ها با حفظ میزان پوشش، بهبود داده شده است. علاوه بر این در روش پیشنهادی دوم، با ترکیب مفهوم تسلط پارتو، اعتماد، اطمینان و شباهت در سیستم های توصیه گر مبتنی بر اعتماد، کارایی این سیستم ها در بهبود دقت و پوشش بر روی کاربران و آیتم ها افزایش یافته است.
  34. طبقه بندی داده های نامتعادل با استفاده از روش های نمونه برداری و یادگیری حساس به هزینه
    1393
    مساله طبقه بندی داده های نامتعادل یکی از مسائلی است که اخیراً توجه زیادی از مهندسین و محققین را به خود جذب کرده است. داده های نامتعادل در واقع نوعی از داده هاست که در آن تعداد نمونه های یک کلاس نسبت به دیگر کلاس ها بسیار بیشتر (یا بسیار کمتر) است. در نتیجه الگوریتم های طبقه بندی کننده به کلاس اکثریت بایاس شده و در بیشتر موارد کلاس نمونه های ورودی جدید را از نوع اکثریت تشخیص می دهد که این امر منجر به کاهش کارایی آنها در مواجهه با این نوع داده می شود. یکی از پرکاربردترین تکنیک هایی که جهت برخورد با داده های نامتعادل به کار می رود، تغییر توزیع کلاس ها با روش های رایجی چون تکنیک های افزایش نمونه یا کاهش نمونه و همچنین سازگار کردن طبقه بندی کننده ها است. در این پایان نامه دو راهکار برای افزایش کارایی طبقه بندی کننده ها در مواجهه با داده های نامتعادل ارائه شده است. ایده اصلی در روش پیشنهادی اول استفاده از دو معیار تنوع و تفکیک پذیری در افزایش نمونه ی کلاس اقلیت است که معیار تنوع در جهت کاهش بیش یادگیری و معیار تفکیک پذیری با جلوگیری از تولید نمونه های ریسک پذیر، تاثیر مثبتی در متعادل سازی توزیع کلاس ها داشته است. روش پیشنهادی اول بر روی 11 مجموعه داده ای با سه نوع طبقه بندی کننده بر اساس شش معیار ارزیابی با چهار روش پیشین مورد مقایسه و ارزیابی قرار گرفته است. در روش پیشنهادی دوم طبقه بندی بیز ساده، به گونه ای تغییر داده شده است که در طبقه بندی کلاسهای اکثریت و اقلیت هزینه های متفاوتی را اعمال نماید. در این روش از ماتریس جریمه مناسب، به منظور کاهش بایاس طبقه-بندی کننده به سمت کلاس اکثریت استفاده شده است. نتایج کار بر روی نه مجموعه داده ای و با بهره گیری از شش معیار ارزیابی داده های نامتعادل و با استفاده از منحنی هزینه نهایی، دقت و عملکرد طبقه بندی کننده بیزین ساده با طبقه بندی کننده استاندارد مورد ارزیابی قرار گرفته است. طبق نتایج به دست آمده دقت روش پیشنهادی در بیشتر موارد افزایش یافته و یا قابل مقایسه با طبقه بندی کننده استاندارد می باشد و از طرفی با اعمال ماتریس جریمه، هزینه نهایی طبقه بندی کننده حساس به هزینه در بیشتر موارد، پایین تر از طبقه بندی کننده بیزین ساده استاندارد می باشد
  35. ارائه یک راهکار مبتنی بر روابط اعتماد به منظور افزایش کارایی سیستم های توصیه گر
    1393
    با توسعه ی سریع محیط جهانی وب، افراد می توانند دانش و اطلاعات خود را از طریق مجموعه ای از ابزارهای انتشار برخط نظیر سیستم های اشتراک گذاری برخط و یا سایت های تجارت الکترونیک، به اشتراک بگذارند. تاکنون ابزارهای زیادی جهت کنترل و سازماندهی این اطلاعات ارائه شده اند. سیستم های توصیه گر، نمونه ای از موفق ترین ابزارهای شخصی سازی وب هستند. مهم ترین وظیفه ی یک سیستم توصیه گر، شناسایی و معرفی آیتم های مورد علاقه ی کاربر در یک فضای بسیار بزرگ از آیتم های قابل انتخاب ( مثل موسیقی، فیلم، کتاب، صفحه وب و ...) است. یکی از معروف ترین و پرکاربردترین سیستم های توصیه گر، روش پالایش گروهی می باشد که از شباهت بین کاربران برای تولید پیشنهاد استفاده می کند. با وجود اینکه این روش ها دقت بالایی در تولید پیشنهاد دارند، اما اغلب دارای ضعف هایی نیز می باشند. این روش ها برای محاسبه ی شباهت بین کاربران نیاز دارند که هر کاربر به تعداد زیادی از آیتم ها رتبه داده باشد که در دنیای واقعی به ندرت این اتفاق می افتد. یک راهکار برای برطرف کردن این مشکل استفاده از مفهوم اعتماد در کنار رتبه های ارائه شده توسط کاربر است که منجر به معرفی سیستم های توصیه گر مبتنی بر اعتماد شده است. سیستم های توصیه گر مبتنی بر اعتماد، یک شبکه ی اعتماد از کاربر هدف به منظور تولید پیشنهاد ایجاد می کنند. یکی از مهم ترین کاربرد های شبکه ی اعتماد، برطرف کردن مشکل انتخاب همسایگی برای کاربر هدف می باشد، زیرا همبستگی زیادی بین روابط اعتماد و مقادیر شباهت کاربران وجود دارد. بنابراین، روابط اعتماد می توانند به عنوان یک منبع اطلاعاتی موثر برای پیش بینی رتبه ها در سیستم های توصیه گر، مورد استفاده قرار گیرند. در این پایان نامه دو روش جدید مبتنی بر حافظه و مبتنی بر مدل به منظور افزایش دقت پیش بینی رتبه ها و رفع مشکل انتخاب همسایگی در سیستم های توصیه گر ارائه شده اند. در روش مبتنی بر حافظه از یک معیار قابلیت اطمینان به منظور افزایش دقت پیش بینی رتبه ها استفاده شده است. بعلاوه، یک روش بازسازی شبکه ی اعتماد بر اساس معیار قابلیت اطمینان ارائه شده، به منظور افزایش دقت و قابلیت اطمینان پیش بینی ها ارائه شده است. در روش مبتنی بر مدل یک روش خوشه بندی جدید به منظور خوشه بندی کاربران و یا آیتم های موجود در سیستم بر اساس تئوری گراف، معیار شباهت و رو
  36. یک روش ترکیبی مبتنی بر بهینه سازی کلونی مورچگان برای انتخاب ویژگی در متن
    1392
    پیشرفت های بوجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی دهه های اخیر باعث ایجاد حجم بزرگی از اطلاعات در بسیاری از علوم شده است. در مقایسه با بسترهای داده ای قدیمی و کوچکتر، بسترهای داده ای امروزی چالش های جدیدی در تحلیل داده ها بوجود آورده اند. روش های آماری سنتی به دو دلیل، امروزه کارائی خود را از دست داده اند. علت اول، افزایش تعداد مشاهدات است و علت دوم که از اهمیت بالاتری برخوردار است افزایش تعداد ویژگی های مربوط به یک مشاهده می-باشد. تعداد ویژگی هایی که برای هر مشاهده باید اندازه گیری شود ابعاد داده نامیده می شود. بسترهای داده ای که دارای ابعاد زیادی هستند علیرغم فرصت هایی که به وجود می آورند، چالش های محاسباتی زیادی را ایجاد می کنند. یکی از مشکلات داده های با ابعاد زیاد این ست که در بیشتر مواقع تمام ویژگی های داده ها برای یافتن دانشی که در داده ها نهفته است مهم و حیاتی نیستند. به همین دلیل در بسیاری از زمینه ها کاهش ابعاد داده یکی از مباحث قابل توجه باقی مانده است. از این رو، انتخاب ویژگی برای کاهش فضای ویژگی و افزایش کارایی دسته بندی متن به کار می رود. در این پژوهش یک روش دو مرحله ای برای انتخاب ویژگی در دسته بندی متن ارائه شده است. در ابتدا یک روش فیلترینگ با استفاده از معیار "انتخاب کننده ویژگی مجزا" اعمال می شود و ویژگی هایی که بیشترین مقدار را دارند انتخاب می شوند. سپس در مرحله بعد، از یک الگوریتم بهینه سازی کلونی مورچگان جدید برای انتخاب ویژگی هایی که در مرحله قبل انتخاب شده اند برای انتخاب بهترین زیرمجموعه از ویژگی ها استفاد می شود. الگوریتم بهینه سازی کلونی مورچگان در مرحله دوم از یک گراف جهت دار مستقیم که حاوی دو یال یکی یال انتخاب و دیگری یال عدم انتخاب یک ویژگی است استفاده می کند. این طرح باعث می شود که برخلاف روش های پیشین که از الگوریتم بهینه سازی کلونی مورچگان استفاده کرده اند، به جای گراف کامل با O(n^2) یال برای نمایش ویژگی ها از یک گراف جهت دار با O(n) یال استفاده شود. یکی دیگر از مشکلات روش های پیشین مشخص کردن تعداد ویژگی به صورت ثابت از ابتداست که باعث می شود تعداد ویژگی های بهینه انتخاب نشوند. گراف استفاده شده در این پژوهش می تواند هر تعداد از ویژگی های برجسته در گراف را در زمان خطی انتخاب کند که دقت دسته بندی را افزایش می دهد.
  37. ارائه چند روش انتخاب ویژگی مبتنی بر راهکار فیلتر با بکارگیری الگوریتم بهینه سازی کلونی مورچه ها
    1392
    امروزه کاربردهای واقعی طبقه بندی که مجموعه های داده ای با حجم زیاد تولید می کنند به سرعت در حال افزایش هستند. مجموعه های داده ای در بسیاری از این کاربردها دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند که بسیاری از این ویژگی ها نامناسب و دارای افزونگی می باشند و می توانند تاثیر منفی بر روی عملکرد الگوریتم های یادگیری داشته باشند. یک راهکار رایج و مهم برای غلبه بر این مشکل، استفاده از تکنیک های انتخاب ویژگی است که هدف آن انتخاب مناسب ترین ویژگی ها از بین مجموعه ویژگی های اولیه، برای افزایش عملکرد الگوریتم های یادگیری است. معمولاً جستجوی جامع برای پیدا کردن مناسب ترین ویژگی ها به لحاظ هزینه محاسباتی غیر ممکن است. بنابراین انتخاب ویژگی تبدیل به یک چالش عمده در شناسایی الگو و یادگیری ماشین شده است. در این پایان نامه، ابتدا یک روش انتخاب ویژگی جدید مبتنی بر راهکار فیلتر ارائه می شود. در این روش، مسئله انتخاب ویژگی به صورت گراف بازنمایی شده و سپس با استفاده از الگوریتم بهینه سازی کلونی مورچه ها مناسب بودن هر ویژگی تعیین خواهد شد. مزیت عمده روش پیشنهادی، استفاده از الگوریتم مبتنی بر هوش جمعی در راهکار فیلتر است که از هیچ طبقه بندی کننده ای در فرآیند انتخاب ویژگی استفاده نمی کند. همچنین شباهت مابین ویژگی ها در تعیین مناسب بودن آنها درنظر گرفته می شود که منجر به کاهش افزونگی خواهد شد. سپس در ادامه پایان نامه، برای بهبود کارایی و بالا بردن سرعت همگرایی روش پیشنهادی اول، چند روش انتخاب ویژگی دیگر مبتنی بر راهکار فیلتر ارائه خواهد شد. در روش بهبود یافته اول، مناسب بودن هر ویژگی به تنهایی محاسبه شده و در فرآیند انتخاب ویژگی در نظر گرفته می شود. در روش بهبود یافته دوم، انتخاب ویژگی افزایشی معرفی می شود که در آن به جای شباهت مابین دو ویژگی، شباهت مابین یک زیرمجموعه از ویژگی ها محاسبه می شود. در روش بهبود یافته سوم، مفهوم سرد شدن تدریجی در الگوریتم بهینه سازی کلونی مورچه ها جهت کنترل تصادفی بودن الگوریتم بکار برده می شود. در نهایت عملکرد روش های پیشنهادی با 11 روش انتخاب ویژگی شناخته شده تک متغیره و چند متغیره مبتنی بر راهکار فیلتر، با استفاده از طبقه بندی کننده های مختلف مقایسه شده است. نتایج آزمایشات نشان می دهد که روش های پیشنهادی، به لحاظ دقت طبقه بندی، عملکرد بهتری نسبت
  38. ارائه یک راهکار ترکیبی مبتنی بر فاکتورسازی ماتریس برای افزایش کارایی سیستم های توصیه گر
    1392
    باتوجه به گسترش سریع و مداوم اینترنت، ضرورت وجود یک سیستم توصیه گر موثر، برای پالایش حجم عظیم اطلاعات، تا حد زیادی افزایش یافته است. یک سیستم توصیه گر، از داده های ورودی برای پیش بینی علایق کاربران استفاده می کند. هدف سیستم های توصیه گر ارائه لیستی از آیتم های مورد علاقه کاربر به اوست. به طورکلی راهکارهای ارائه شده برای سیستم های توصیه گر ، به سه دسته کلی محتوا محور (CB)، پالایش گروهی( CF ) و ترکیبی تقسیم می شوند. در راهکار محتوا محور، آیتم های پیشنهادی، از نظر محتوا، مشابه آیتم های قبلی مورد علاقه ی کاربرِ هدف می باشند. درحالی که در راهکار پالایش گروهی، آیتم های توصیه شده، بر اساس ارزیابی های گذشته ی گروه زیادی از کاربران انتخاب می شوند. پالایش گروهی در مقایسه با راهکارهای دیگر، به دلیل سادگی و کارایی بالا بسیار مورد توجه قرار گرفته است. یکی از کاراترین روش های مورد استفاده در پالایش گروهی برای تخمین رتبه های نامشخص کاربر، فاکتورسازی ماتریس است. دراین پایان نامه، الگوریتم های جدیدی مبتنی بر فاکتورسازی ماتریس جهت رفع چالش های موجود و افزایش دقت، ارائه شده است. بیشتر روش های مبتنی بر فاکتورسازی ماتریس، تنها از رتبه های شناخته شده برای آموزش استفاده می نمایند و قادر به کاهش تاثیر مشکل تُنکی داده نیستند، با این حال، در کاربردهای واقعی، ماتریس رتبه ها، تُنک می باشد. کارایی روش های فاکتورسازی ماتریس، به چگونگی مدل سازی سیستم ، برای کاهش تُنکی داده بستگی دارد. بدین منظور، در این پایان نامه، یک الگوریتم جدید به نام PMULT برای افزایش کارایی سیستم و از بین بردن چالش تُنکی ماتریس، با به کارگیری رتبه های پیش تخمین از درآیه های نامشخص، ارائه شده است. بسیاری از سیستم های توصیه گر مبتنی بر فاکتورسازی ماتریس، به صورت زنجیره ای، عمل نموده و به همین دلیل سرعت اجرای آنها برای ماتریس های بزرگ بسیار کم خواهد بود. لذا یک راهکار برای افزایش سرعت، موازی سازی روش های فاکتور سازی ماتریس است. در این پایان نامه، باهدف موازی سازی توصیه گر پالایش گروهی برمبنای فاکتورسازی ماتریس، چهار الگوریتم موازی مبتنی بر فاکتورسازی ماتریس (C-MULT، S-MULT، C-PMULT و S-PMULT) برای کاهش هزینه محاسباتی و غلبه بر چالش مقیاس پذیری، ارائه شده است. علاوه بر این، سیستم های توصیه گر مبتنی بر فاکتورسازی ماتریس، از ن
  39. بهبود کارایی سیستم های پالایش گروهی با استفاده از تکنیک های خوشه بندی
    1392
    سیستم های توصیه گر، سیستم هایی هستند که برای پیشنهاد کردن آیتم هایی بکار برده می شوند که انتظار می رود این آیتم ها مورد علاقه کاربر قرار گیرند. در سیستم های توصیه گر یک تکنیک پر کاربرد به نام سیستم های پالایش گروهی وجود دارد. این سیستم ها بر این فرضیه استوارند که می-توان اولویت های تعریف شده برای آیتم ها از سوی تعدادی از کاربران را برای سایر کاربران هم به اشتراک گذاشت. بنابراین، در این سیستم ها، هدف اصلی، یافتن یک گروه از شبیه ترین کاربران به کاربر فعال است. معیارهای شباهت، یکی از رایج ترین روش ها برای یافتن کاربران مشابه به کاربر فعال است. با استفاده از این روش، میزان شباهت کاربران نسبت به هم اندازه گیری شده و نهایتاً بر اساس این معیار ها، شبیه ترین کاربران به کاربر فعال به عنوان کاربران همسایه انتخاب می شوند. در این روش ها، برای انتخاب کاربران همسایه، محاسبات بر اساس ماتریس امتیازات کاربران به آیتم ها انجام می شود. اما این روش با چالش هایی مانند خلوت بودن ماتریس امتیازات، مقیاس پذیری و همچنین مشخص نبودن تعداد بهینه کاربران همسایه روبرو است. بعلاوه، در توصیه کردن آیتم ها روش هایی وجود دارند که خیلی از اطلاعات آماری امتیازات استفاده نمی کنند. یک راهکار دیگر برای یافتن کاربران مشابه به کاربر فعال، استفاده از روش های خوشه بندی است. از روش های خوشه بندی برای دسته بندی کردن کاربران در قالب خوشه هایی استفاده می شود که کاربران یک خوشه دارای بیشترین شباهت به هم هستند. در این پایان نامه دو راهکار مبتنی بر خوشه بندی، برای یافتن کاربران شبیه به هم در سیستم های پالایش گروهی پیشنهاد شده است. در راهکار اول، سعی شده است که با استفاده از روش های پیش پردازش مانند انتخاب ویژگی، تعدادی از آیتم های غیر موثر از مجموعه آیتم ها قبل از اعمال روش های خوشه بندی جهت یافتن کاربران همسایه، حذف شوند. نتایج آزمایشات نشان دهنده بهبود کارایی این روش است. در راهکار پیشنهادی دوم، یک روش جدید برای یافتن کاربران ارائه شده است که در این روش نیاز به مشخص نمودن تعداد خوشه ها برای خوشه بندی نیست. در این روش با استفاده از زیر مجموعه ای از آیتم های مورد علاقه کاربران که توسط چند کاربر امتیاز بالایی دریافت کرده اند، کاربران شبیه بدون در نظر گرفتن اینکه دارای امتیازات داده شده به آیتم های مشترکی باشند، در یک
  40. راهکارترکیبی برای انتخاب ویژگی در داده های ابعاد بالا
    1391
    با پیشرفت روزافزون تکنولوژی در زمینه داده کاوی در حوزه های علمی مختلف، مجموعه داده های با ابعاد بسیار بالا در حال افزایش است که منجر به کاهش کارایی الگوریتمهای دسته بندی می شود. لذا نیاز به کاهش حجم این مجموعه داده ها امری ضروری است. در مجموعه داده ها با ابعادبالا، تعداد زیادی ویژگی برای هرنمونه وجود دارد که بسیاری از آنها نامرتبط و زاید می باشند. در این پایان نامه برروی انتخاب ویژگی بر روی مجموعه داده های ابعادبالای دو حوزه مختلف علم، بیوانفورماتیک و متن، کارشده است. برای هریک از این حوزه ها راهکارهای انتخاب ویژگی متفاوتی توسط محققان ارایه شده است که این راهکارها وابسته به ماهیت ویژگی های حوزه مورد نظر می باشد. مثلا ویژگی های داده های میکروآرایه مقدار "بیان ژن ها" می باشند که عددی حقیقی می باشد در حالی که در متن، ویژگی ها واژه ها بوده که الگوریتمهای ارائه شده در این حوزه بر روی خصوصیت آماری آنها که ماهیتی گسسته دارد تمرکز دارد. راهکارهای ارائه شده برای انتخاب ویژگی به دو دسته کلی باناظر و بی ناظر تقسیم بندی می شوند. راهکارهای باناظر از برچسب کلاس ها در انتخاب ویژگی کمک می گیرند، در حالی که در حالت بی ناظر تنها از مقادیر ویژگی ها استفاده می شود. تحلیل واریانس از راهکارهای بی ناظر می باشد که از دیرباز مورد توجه محققان بوده است. در قسمت اول این پایان نامه، روش های انتخاب ویژگی بی ناظر و با ناظر با تکیه بر استخراج ویژگی، تحلیل واریانس و خوشه بندی پیشنهاد شده است. روش ارایه شده بر روی شش مجموعه داده بزرگ بیوانفورماتیک که ویژگی های آن ژن ها می باشند، اعمال شده است. آزمایشات و بررسی های مختلف انجام گرفته نشان می دهند که روش بی ناظر و باناظر پیشنهادی در مجموعه داده های مختلف کارایی قابل قبولی را کسب نموده است. در راهکار پیشنهادی دوم پایان نامه، روش انتخاب ویژگی مبتنی بر فیلتر با تکیه بر عامل های احتمالاتی تاثیرگذار در دسته بندی متن که در روش های انتخاب ویژگی احتمالاتی پرکاربرد به کار رفته، ارایه می شود. روش ارایه شده از جنبه های مختلف مورد تحلیل قرارگرفته و کارایی ویژگی های انتخابی آن در دسته بندی متن با روش های دیگر انتخاب ویژگی مبتنی بر فیلتر مقایسه شده است. آزمایشات متعدد، روش های فیلتر را از جنبه های مختلف همانند: میزان اشتراک ویژگی های برتر انتخاب شده، بررسی واریانس و
  41. راهکاری جدید جهت بهبود کارایی معیارهای اندازه گیری شباهت کاربران در سیستم های توصیه گر
    1391
    کاربرد عمومی از وب به عنوان یک سیستم اطلاعات جهانی موجب شده تا کاربران با حجم عظیمی از اطلاعات و داده ها سروکار داشته باشند. کاربران در مواجهه با این حجم عظیم اطلاعات از ده ها هزار منبع، دچار سردرگمی در انتخاب اطلاعات موردنظر خود می شوند. ابزاهایی جهت کنترل و سازمان دهی این اطلاعات ارائه شده اند. سیستم های توصیه گر، نمونه ایی از موفق ترین ابزارهای شخصی سازی وب هستند. مهمترین وظیفه یک سیستم توصیه گر، کشف آیتم های مورد علاقه کاربر در یک فضای بسیار بزرگ از آیتم های قابل انتخاب است. بنابراین سیستم توصیه گر می تواند کاربر را در انتخاب از میان انبوه اطلاعات یاری رساند. یکی از معروف ترین راهکارهای ارائه شده برای سیستم توصیه گر، صافی سازی تجمعی است. برای یک کاربر خاص، در این راهکار با استفاده از رتبه های داده شده به آیتم ها توسط کاربران مشابه، به پیش بینی و پیشنهاد آیتم های جدید به این کاربر خاص پرداخته می شود. در این راهکار، جهت شناسایی کاربران مشابه با کاربر خاص، از معیارهای شباهتی استفاده می شود که به عنوان یک فاکتور مهم در افزایش کارایی سیستم های توصیه گر عمل می نمایند. معیارهای شباهت ارائه شده در سیستم صافی سازی تجمعی بر اساس اطلاعات ماتریس کاربر-آیتم ( که شامل رتبه های کاربران به آیتم هاست) به اندازه گیری شباهت کاربران می پردازند. این معیارها با چالش هایی از جمله شروع سرد ( کاربر تازه وارد به سیستم که تعداد کمی از آیتم ها را رتبه بندی کرده است) ، رتبه هموار (کاربرانی که به آیتم های مختلف، رتبه های مشابهی داده اند )، تعداد آیتم مشترک (تعداد آیتم های مشترک رتبه داده شده بین دو کاربر کم است) و تنکی ماتریس کاربر-آیتم ( تعداد آیتم های رتبه داده نشده زیاد است) مواجهه هستند. در این پایان نامه، معیارهای شباهت جدیدی جهت رفع این مشکلات ارائه شده‎ اند. یکی از این معیارهای ارائه شده، معیار شباهت مبتنی بر رتبه است که چالش های تعداد رتبه مشترک و رتبه هموار را برطرف نموده است. معیار شباهت ارائه شده دیگر، با استفاده از پروفایل کاربران، مشکل تنکی ماتریس کاربر-آیتم را برطرف نموده است. همچنین در این پایان نامه، چارچوب هایی از این معیارها جهت بهبود عملکرد معیارهای مبتنی بر ماتریس کاربر-آیتم ارائه شده اند. علاوه بر این، معیارهایی بر اساس تحلیل سلسله مراتبی جهت افزایش دقت ا
  42. راهکار جدید برای افزایش کارایی در سیستم های پالایش گروهی با استفاده از فاکتورسازی ماتریس
    1391
    اینترنت به عنوان ابزاری در دسترس همگان، حجم فراوانی از داده ها را به عنوان فرصتی مناسب پیش روی کاربران خود قرار داده است. به طوری که امروزه با توجه به حجم روزافزون داده و اطلاعات، نیاز به سیستم هایی که توانایی هدایت کاربران به سمت کالا و سرویس مورد نظر را داشته باشند بیش از پیش احساس می شود. سیستم های توصیه گر از طریق تحلیل این داده ها به کاربران، کالا یا خدماتی را توصیه (پیش بینی) می کنند. این داده ها می تواند شامل رفتار مشتریان در خرید های قبلی، علایق و سلایق و حتی موقعیت جغرافیایی، اولویتها و تعداد مراجعات او در هر بار ورود به فروشگاه مجازی، سن، شغل و مواردی از این قبیل می باشد. نمونه ای از سیستم های توصیه گر در دنیای واقعی، سایت آمازون می باشد، که به هر کاربری با توجه به سابقه ای که دارد به او کالا یا خدماتی را پیشنهاد می دهد. سیستم های توصیه گر به دو دسته کلی سیستم های توصیه گر مبتنی بر محتوا و سیستم های توصیه گر پالایش گروهی تقسیم می گردند. سیستم های پالایش گروهی به دلیل اینکه فقط به رتبه کاربران به آیتم هایی که قبلا خریده اند، نیاز دارند و به هیچ گونه اطلاعات اضافه ی دیگری مثل مشخصات کاربران یا اطلاعات کالا احتیاجی ندارند، بسیار مورد توجه سرمایه گذاران تجاری می باشد. سیستم های توصیه گر پالایش گروهی دارای روش های متعددی است، که یکی از معروفترین و پر کاربردترین آن روش های فاکتورسازی ماتریس است. به صورت کلی خروجی نهایی فاکتورسازی ماتریس در سیستم های توصیه گر، ماتریس تقریبی کامل شده ای می باشد که سطرهای آن کاربران و ستون های آن آیتم ها می باشند. درایه های این ماتریس بیانگر رتبه ای است که کاربری به آیتمی خاص داده است. واضح است که این ماتریس در ابتدا بسیار خالی می باشد. در این پایان نامه سیستم های توصیه گر مبتنی بر پالایش گروهی مورد توجه قرار گرفته اند. اولین کار جدیدی که انجام شده است وارد کردن مباحث تکاملی در فاکتورسازی ماتریس می باشد. که در اینجا فقط الگوریتم ژنتیک مورد بررسی و تحلیل قرار گرفته است. ماتریس رتبه بسیار خالی می باشد، راه کاری برای این کار استفاده از روش های پیش پردازش می باشد، که اخیرا معرفی شده است. در فاکتورسازی ماتریس، کامل سازی ماتریس و فرایند یادگیری زمانبر می باشد و نمی تواند به صورت آنلاین انجام شود. حال اگر کاربری رتبه جدیدی به آیتمی دهد، ه
  43. نشانه گذاری کارای تصاویر دیجیتال بر مبنای روش های تکراریِ فشرده سازی نشانه
    1391
    در دهه های اخیر با پیشرفت سریع تکنولوژی اطلاعات و گسترش شبکه اینترنت، امکان استفاده یا تغییر غیرمجاز داده ها مانند کپی و یا جعل با سرعت قابل توجهی افزایش یافته است. در همین راستا، این امکان باعث شده است که مساله امنیت و حفاظت اطلاعات به صورت جدی تری مطرح گردد. راه حل های مختلفی برای حل این مساله ارائه گردیده است. یکی از این روش ها، نشانه گذاری می باشد. نشانه گذاری به فرایند درج یا تعبیه یک نشانه ( متن، صدا، تصویر و غیره) در داخل داده میزبان گفته می شود و برای کاربردهایی چون اثبات مالکیت، شناسایی صاحب اثر، کنترل کپی، تعیین اعتبار محتوی و بایگانی به کار برده می شود. در این پایان نامه، سه الگوریتم برای نشانه گذاری تصاویر رقمی در حوزه ی تبدیل های موجک و تجزیه مقادیر منفرد ارائه شده است. بر خلاف الگوریتم های رایج که از یک تصویر نشانه ی خاکستری استفاده می کنند، در الگوریتم های اول و دوم پیشنهادی که جزء روش های نشانه گذاری نیمه کور می باشند، از روشهای تکرار برای تولید تصاویر نشانه استفاده شده ست. در این دو روش بجای ذخیره سازی مستقیم تصویر نشانه، روش تولید تصویر نشانه در تصویر میزبان ذخیره می گردد. در الگوریتم پیشنهادی اول، ابتدا تصویر نشانه استفاده شده توسط متد CPPN-NEAT تولید می شود و سپس بجای استفاده مستقیم از این تصویر تولید شده، ماتریس وزن ساختار شبکه CPPN انتخابی در عملیات نشانه گذاری مورد استفاده قرار می گیرد. در مرحله جاسازی از این الگوریتم، ابتدا تصویر میزبان توسط چند مرحله اعمال تبدیل موجک گسسته به زیرباندهای فرکانسی تجزیه می شود. از زیرباندهای بدست، به یک زیرباند خاصی در سطح های مختلف(از اعمال تبدیل موجک) تجزیه مقادیر منفرد گرفته می شود. با توجه به اهمیت ضرایب موجود در ماتریس وزن ساختار CPPN انتخابی، عملیات درج در ماتریس های مقادیر ویژه انجام می گردد. الگوریتم استخراج نشانه روالی عکس با مرحله جاسازی دارد. بعد از استخراج ماتریس وزن، این ماتریس را در ژنومی که با عنوان کلید استخراج داشتیم، قرار داده و متد CPPN-NEAT را دوباره اجرا می کنیم تا تصویر نشانه اصلی بازسازی گردد. نتایج پیاده سازی، شفافیت بالا و مقاومت مناسب روش پیشنهادی را نشان می دهد. در الگوریتم پیشنهادی دوم، تصویر نشانه اصلی در ابتدا از مجموعه تصاویر فراکتالی انتخاب شده، سپس با استفاده از خصوصیات این نوع
  44. اکتساب افزایشی مهارت در یادگیری تقویتی با استفاده از معیارهای مرکزیت گراف
    1391
    یادگیری تقویتی یکی از حوزه های یادگیری ماشین است که به بررسی رفتار عامل هوشمند در محیط های تصادفی و ناشناخته می پردازد. در یادگیری تقویتی عامل هوشمند بایستی از طریق سعی و خطا با محیط ارتباط برقرار کرده و با گذشت زمان و با دریافت سیگنال های تقویتی از محیط رفتار خود را بهبود دهد. اغلب روش های یادگیری تقویتی در برخورد با مسائل پیچیده و بزرگ دچار مشکل می شوند. به منظور کاهش پیچیدگی، اغلب مسائل بزرگ به زیر مسائل کوچکتر شکسته می شوند و با حل این زیرمسائل ساده تر، راه حلی برای مسئله پیچیده اصلی ارائه می گردد. بدین ترتیب یک ساختار سلسله مراتبی از مسئله ارائه می گردد. در یادگیری تقویتی سلسله مراتبی، یکی از روش های تجزیه مسائل بزرگ به زیرمسائل کوچکتر، شناسایی اهداف میانی مسئله است. اهداف میانی که زیرهدف نیز نامیده می شوند، حالت هایی هستند که برای رسیدن به هدف سودمند می باشند و سرعت یادگیری عامل را افزایش می دهد. با شناسایی اهداف میانی، سپس مهارت رسیدن به حالت های میانی شناسایی شده برای عامل ایجاد می-گردد. مهارت یا عمل مجرد، دنباله ای از اعمال پایه یا اعمال مجرد دیگر است که به صورت یک عمل واحد در نظر گرفته می شود. عامل هوشمند با یک بار فراگیری مهارت، قادر خواهد بود در آینده مجدداً از آن استفاده کرده و بدین ترتیب سرعت یادگیری خود را افزایش دهد. در این پایان نامه یک روش مبتنی بر نظریه گراف برای شناسایی اهداف میانی ارائه شده است. روش رائه شده از طریق معیارهای مرکزیت گراف، اهداف میانی را شناسایی می کنند. روش های پیشنهادی پایدار بوده و وابسته به تابع پاداش و تعداد ملاقات حالات نیست، بنابراین می توان از آن ها برای شناسایی اهداف میانی در محیط های گوناگون استفاده کرد. در این پایان نامه از چارچوب سلسله مراتبی گزینه برای نمایش مهارت ها استفاده شده است.
  45. اکتساب مهارت در یادگیری تقویتی با استفاده از مدل های آماری خوشه بندی گراف
    1391
    یادگیری تقویتی با مسئله یادگیری عامل هوشمند برای انتخاب اعمال به منظور بیشینه کردن کارایی عامل سروکار دارد. استفاده از مهارت ها در یادگیری تقویتی، سبب سرعت بخشیدن به کارکرد عامل می شود. یافتن اهداف میانی و ایجاد مهارت برای دست یابی به آنها، مسئله ای کلیدی در کشف خودکار مهارت می باشد. با کشف اهداف میانی و تعیین تابع سیاست دست یابی به آنها، عامل قادر به اکتشاف موثرتر ویادگیری سریع تر در کارهای دیگر در محیط های یکسان یا مشابه است. در این پژوهش، از رویکرد مبتنی بر گراف برای کشف اهداف میانی استفاده شده است. دو مدل آماری برای خوشه بندی گراف ارائه گشته است. مهارت ها به صورت زیر سیاست هایی تعریف می شوند که انتقال موثر از یک خوشه به خوشه دیگر را برای عامل فراهم می سازند. مجموعه داده های شناخته شده در خوشه بندی گراف و مثال اتاق ها در یادگیری تقویتی مورد استفاده قرار گرفته اند و نتایج بدست آمده نشان دهنده کارایی روش ارائه شده می باشد.
  46. بهبود نتایج سیستم های توصیه گر با استفاده از تکنیکهای کامل سازی ماتریس
    1391
    با توجه به رشد روز افزون داده ها و اطلاعات در دنیای امروز، نیاز به فیلترکردن اطلاعات برای استفاده مطلوب از آنها بیش از پیش احساس می شود و بدون راهنمایی و هدایت درست، ممکن است انتخاب هایی غلط و یا غیر بهینه از میان آن ها داشته باشیم. در این میان سیستم های توصیه گر تاثیر بسزایی در راهنمایی و هدایت کاربران در میان حجم عظیمی از انتخاب های ممکن، برای رسیدن به گزینه مفید و مورد علاقه آنها را دارند. سیستم های توصیه گر را زیرمجموعه ای از سیستم های پشتیبان تصمیم می دانند و از آنها به عنوان سیستم های اطلاعاتی یاد می کنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیه هایی برای مسائل جاری را دارا هستند. به زبان ساده تر در سیستم های توصیه گر تلاش بر این است تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه وی و نظرات آن ها موجود است، مناسب ترین و نزدیک ترین کالا به سلیقه او شناسایی و پیشنهاد شود. سیستم های پالایش گروهی به عنوان برجسته ترین و پرکاربردترین نوع سیستم های توصیه گر بخش عمده ای از تحقیقات در این زمینه را به خود اختصاص داده است. در سیستم های توصیه گر تنها تعداد کمی از آیتم ها توسط هر کاربر رتبه دهی می شود لذا متدهای پالایش گروهی با یک ماتریس خلوت سر و کار دارند. این مسئله منجر به کاهش دقت در ارائه پیشنهادات این سیستم ها می شود. یکی از راهکارها برای غلبه بر این مشکل، استفاده از تکنیک های کامل سازی ماتریس است. در این تکنیک، ماتریس رتبه، به دو یا چند ماتریس شکسته شده و با حاصلضرب آنها ماتریس رتبه دوباره بازسازی شده و در نتیجه منجر به مشخص شدن عناصر نامشخص ماتریس رتبه می شود. در این پایان نامه، یک روش ترکیبی مبتنی بر تکنیک کامل سازی ماتریس برای بهبود نتایج سیستم های توصیه گر ارائه شده است. در روش پیشنهادی این پایان نامه، تکنیک کامل سازی ماتریس با استفاده از بهینه سازی محدب هر بار با یکی از سه معیار برجسته انتخاب همسایگی همچون متد همبستگی پیرسن، متد تحلیل معنایی نهان مبتنی بر احتمال و متد جکارد از طریق میانگین مجذور فاصله ها ادغام شده است.
  47. خوشه بندی گراف با استفاده از مدل های آماری
    1391
    در سالهای اخیر توجه زیادی به سمت کشف خوشه ها در خصوصیات شبکه های مختلف معطوف شده است. شبکه هایی نظیر اینترنت، وب گسترده جهانی، شبکه حمل و نقل، شبکه های ایمیل، شبکه-های اجتماعی و زیستی و... مثال هایی از این نوع شبکه ها هستند. به فرآیند گروه بندی کردن راس های گراف به داخل خوشه ها بطوری که در داخل هر خوشه تراکم یال ها زیاد و بین خوشه ها تراکم نسبتا کم باشد خوشه بندی کردن گراف گفته می شود. در سال های اخیر الگوریتم های زیادی برای شناسایی این ساختارها توسعه داده شده اند. از آنجایی که در کاربردهای واقعی اندازه داده ها با سرعت زیادی افزایش می یابد، کارایی الگـوریتم های کلاسیک برای گراف های بزرگ کاهش پیدا می کند. درچنین وضعیتی الگوریتم های خوشه بندی مبتنی بر مدل، یک جایگزین مناسب برای نوع های کلاسیک هستند. کارایی الگوریتم های خوشه بندی گراف مبتنی بر مدل به مقداردهی اولیه صحیح پارامترهای آن وابسته است. به همین منظور، در این پایان نامه یک الگوریتم تکاملی به منظور پیدا کردن مقادیر مناسب برای الگوریتم های خوشه بندی گراف مبتنی بر مدل ارائه شده است. روش ارائه شده هم بر روی داده های شبیه سازی شده و هم بر روی داده های واقعی مورد آزمایش قرار گرفته است و نتایج بدست آمده نشان دهنده افزایش کارایی روش پیشنهادی در مقایسه با مقداردهی تصادفی پارامترها است.
  48. انتخاب ویژگی در متن با استفاده از یک روش بهینه سازی ترکیبی
    1390
    دسته بندی متن نقش مهمی را در مدیریت اطلاعات ایفا می کند. به دلیل افزایش حجم اطلاعات موجود در اینترنت، دسته بندی خودکار متن ها بسیار مورد توجه قرار گرفته شده است. یکی از مشکلات دسته بندی متن، ابعاد بالای فضای ویژگی است. اغلب ویژگی ها نامربوط و زائد هستند و بر کارایی دسته بندی کننده تاثیر منفی می گذارند. ازاینرو، انتخاب ویژگی برای کاهش فضای ویژگی و افزایش کارایی دسته بندی متن به کار می رود. در این پژوهش یک روش سه مرحله ای برای انتخاب ویژگی در دسته بندی متن ارائه شده است. در ابتدا یک روش فیلترینگ با استفاده از معیار آنتروپی فازی یا بهره اطلاعات اعمال می شود و ویژگی ها بر مبنای مقداری که دارند، رتبه بندی می شوند. اگر در گام اول روش آنتروپی فازی استفاده شود، ویژگی هایی که بیشترین مقدار و هرگاه روش بهره اطلاعات بکار رود، ویژگی هایی که کمترین مقدار را دارند از مجموعه ویژگی ها حذف می شوند. سپس در گام دوم، الگوریتم بهینه سازی کلونی مورچه ها برای انتخاب ویژگی هایی که در گام اول حذف نشده اند، اعمال می شود. در گام آخر الگوریتم ژنتیک برای کاهش ابعاد ویژگی هایی که توسط الگوریتم بهینه سازی کلونی مورچه ها بدست آمده است، مورد استفاده قرار می گیرد. در این پژوهش از یک دسته بندی کننده نزدیکترین همسایگی برای دسته بندی 10 کلاس برتر رویترز 21578 استفاده شده است و نتایج بدست آمده نشان دهنده کارایی روش ارائه شده می باشد.
  49. شخصی سازی موتورهای جستجو با استفاده از روشهای هوشمند
    1388
    امروزه رشد و تغییر نمایی در حجم اطلاعات وب موجب عدم دسترسی سریع و آسان کاربران به اطلاعات مورد نیازشان شده است. اگرچه بکارگیری ابزارهایی مثل موتورهای جستجو می تواند به کاربران در یافتن اطلاعات مورد نیازشان کمک نماید و باعث تسریع و تسهیل دسترسی به اطلاعات وب شود، اما حجم اطلاعاتی که موتورهای جستجو به کاربر تحویل می دهند، معمولا بسیار بیشتر از آن است که قابل پردازش سریع توسط کاربر باشد. علاوه بر این اغلب موتورهای جستجو از محتوای صفحات و ساختار پیوند بین آنها برای تعیین میزان ارتباط صفحات با پرس وجوی کاربر استفاده می کنند. در واقع موتورهای جستجو علایق و دانش پیش زمینه کاربر را در جستجو مورد توجه قرار نمی دهند و نتایج مشابهی را برای کاربران با علایق متفاوت و پرس وجوی یکسان بازیابی می نمایند. بنابراین با توجه به اهمیت دسترسی سریع به اطلاعات مناسب برای کاربران در تعامل با وب، شخصی سازی کردن وب به یک پدیده محبوب به منظور سفارشی کردن محیط های وب تبدیل شده است. در این میان شخصی سازی نتایج حاصل از موتورهای جستجوی وب از اهمیت خاصی برخوردار می باشد. فرآیند شخصی سازی می تواند بعنوان یک کاربرد داده کاوی در نظر گرفته شود که شامل همه فازهای یک چرخه داده کاوی رایج از قبیل جمع آوری داده، پیش پردازش، کشف الگو و توسعه دانش بعنوان واسطه بین کاربر و وب می باشد. هدف اصلی در یک سیستم شخصی سازی، فراهم نمودن اطلاعات مورد نیاز کاربران برطبق علایق آنها و بدون دخالت صریح کاربران می باشد. این در حالی است که بررسی های انجام شده نشان می هد که در رویکردهای استفاده شده تاکنون، سیستمی که بتواند فرآیند شخصی سازی را بصورت اتوماتیک و مستقل از کاربر و یا شخص خبره انجام دهد، به چشم نمی خورد. علاوه بر این در سیستم های شخصی سازی که بصورت جمعی عمل می مایند، قابلیت بروز رسانی و سازگاری با تغییر در کاربران و علایق آنها وجود ندارد. وجود چنین خلاهایی ما را بر آن داشت تا به دنبال ارائه روش های شخصی سازی باشیم که علاوه بر اتوماتیک بودن و قابلیت سازگاری با تغییر در کاربران و علایق آنها، از روش های هوشمند مبتنی بر یادگیری ماشین مانند تکنیک های فازی، الگوریتم های داده کاوی و غیره در راستای بهبود نتایج بدست آمده و افزایش کارایی سیستم استفاده نماید. در راستای این اهداف سه روش برای شخصی سازی نتایج موتورهای جستجو ارائه م
  50. کنترل اتوماتیک تولید با استفاده از سیستمهای چند عامله
    1388
    در این پایان نامه، از کنترل کننده های هوشمندی استفاده شده است که در ساختار آن ها، از استانداردهای عملکرد کنترل بهره گرفته شده است تا علاوه بر کنترل مناسب بار-فرکانس، از این استانداردها پیروی کنند. نتایج نشان داد با به کارگیری استانداردهای عملکرد در ساختار کنترل کننده، عملکرد کنترل کننده در برآوردن اهداف کنترلی از جمله کاهش زمان نشست و فراجهش بهبود می یابد. در این پایان نامه، علاوه بر استفاده از الگوریتم های کلاسیک، از کنترل کننده مبتنی بر سیستمهای چندعامله و با لحاظ کردن استانداردهای عملکرد استفاده شد تا هم از فرسودگی تجهیزات گاورنر کم کند و هم از استانداردهای عملکرد NERC پیروی کرده تا قابلیت اطمینان را افزایش دهد. نتایج نشان می دهد که کنترل کننده هایی که از استانداردهای NERC پیروی می کنند، عملکرد مناسب تری داشته و پاسخ فرکانسی آن ها بهبود یافته است.