Faculty Profile

فاطمه دانشفر
تاریخ به‌روزرسانی: 1403/06/29

فاطمه دانشفر

دانشکده مهندسی / گروه مهندسی کامپیوتر و فناوری اطلاعات

Theses Faculty

پایان‌نامه‌های کارشناسی‌ارشد

  1. Multi-objective Manifold Representation for Opinion Mining
    1403
    Sentiment analysis is an essential task in numerous domains, necessitating effective dimensionality reduction and feature extraction techniques. This study introduces MultiObjective Manifold Representation for Opinion Mining (MOMR). This novel approach combines deep global and local manifold feature extraction to reduce dimensions while capturing intricate data patterns efficiently. Additionally, incorporating a self-attention mechanism further enhances MOMR's capability to focus on relevant parts of the text, resulting in improved performance in sentiment analysis tasks. MOMR was evaluated against established techniques such as Long Short-Term Memory (LSTM), Naive Bayes (NB), Support Vector Machines (SVM), Recurrent Neural Networks (RNN), and Convolutional Neural Networks (CNN), as well as recent state-of-the-art models across multiple datasets including IMDB, Fake News, Twitter, and Yelp. Therefore, our comparative analysis underscores MOMR's efficacy in sentiment analysis tasks across diverse datasets, highlighting its potential and applicability in real-world sentiment analysis applications. On the IMDB dataset, MOMR achieved an accuracy of 99.7% and an F1 score of 99.6%, outperforming other methods such as LSTM, NB, SMSR, and various SVM and CNN models. For the Twitter dataset, MOMR attained an accuracy of 88.0% and an F1 score of 88.0%, surpassing other models, including LSTM, CNN, BiLSTM, Bi-GRU, NB, and RNN. In the Fake News dataset, MOMR demonstrated superior performance with an accuracy of 97.0% and an F1 score of 97.6%, compared to techniques like RF, RNN, BiLSTM+CNN, and NB. For the Yelp dataset, MOMR achieved an accuracy of 80.0% and an F1 score of 80.0%, proving its effectiveness alongside other models such as Bidirectional Encoder Representations from Transformers (BERT), aspect-sentence graph convolutional neural network (ASGCN), Multi-layer Neural Network, LSTM, and bidirectional recurrent convolutional neural network attention (BRCAN).
  2. تجزیه خودبازنما برای یادگیری بازنمایی تعمیم پذیر
    1403
    تجزیه ماتریس نامنفی، به عنوان یک مدل یادگیری بازنمایی گروهی، بازنمایی مبتنی بر جزء را با ویژگی های قابل تفسیر تولید می کند و می تواند برای مسائل مختلف مانند خوشه بندی داده ها به کار گرفته شود. یافته ها نشان می دهد که مدل تجزیه ماتریس نامنفی با واگرایی کولبک-لیبلر و واگرایی β عملکرد امیدوارکننده ای را در کار خوشه بندی متن و انواع داده های مختلف نشان می دهند. با این حال، روش های خوشه بندی متن مبتنی بر تجزیه ماتریس موجود در یک مدل رمزگشا، فاقد چارچوب تایید تعریف شده اند. اخیرا،ً روش های خود بازنمایی برای طیف گسترده ای از وظایف به کار گرفته شده اند، و مدل ها را برای یادگیری مستقل و تایید بازنمایی هایی که به طور کامل پیچیدگی ها و تفاوت های ذاتی در داده های ورودی آن ها را منعکس می کنند، توانمند می سازد. در این پژوهش، ما دو روش تجزیه ماتریس خودبازنمایی را برای خوشه بندی داده ها پیشنهاد می کنیم که اطلاعات معنایی و منظم ساز گراف را به ترتیب در روش های پیشنهادی در فرآیند یادگیری آن مشارکت می دهد. مدل تجزیه ماتریس نامنفی رمزگذار-رمزگشای معنایی مبتنی بر واگرایی کولبک-لیبلر (SEDNMFk (و تجزیه ماتریس رمزگذار-رمزگشا مبتنی بر واگرایی β REDNMF-β ، تجزیه های رمزگذار و رمزگشا را در یک تابع هزینه یکپارچه ادغام می کنند که به طور متقابل یکدیگر را تایید و اصلاح می کنند، و در نتیجه خوشه های متمایزتری تشکیل می شوند. ما الگوریتم های بهینه سازی کارآمد و موثر براساس قوانین به روزرسانی ضربی برای حل مدل یکپارچه روش های پیشنهادی ارائه می کنیم. نتایج تجربی روی ده مجموعه داده شناخته شده نشان می دهد که روش های پیشنهادی ما از سایر روش های خوشه بندی نوین عملکرد بهتری دارد.
  3. Automatic Colorectal Cancer Detection Using Machine Learning and Deep Learning Based on Feature Selection
    1403
    Colorectal cancer (CRC), accounting for 10% of global cancer cases and being the third most prevalent type, is expected to see a significant increase in the coming years. This surge underscores the need for precise diagnostics. Effective treatment relies on accurate histopathological analysis of hematoxylin and eosin (H&E) stained biopsies, which is critical for recommending minimally invasive treatments. However, manual evaluations of these biopsies are labor-intensive and error-prone due to staining variations and inconsistencies, complicating the tasks of pathologists. To address these challenges, advanced automated image analysis, including deep learning with convolutional neural networks (CNNs) and machine learning (ML) techniques, has significantly enhanced computer-aided diagnosis systems. Consequently, this paper proposes a composite model that combines deep learning and machine learning to improve colorectal cancer diagnosis accuracy. Specifically, the model aims to increase diagnostic precision, reduce complexity and computing demands, and effectively prevent overfitting for reliable performance. Therefore, the proposed cascaded design includes feature extraction using MobileNetV2 and DenseNet121 via transfer learning (TL), data distribution balancing in the Extended Bioimaging Histopathological Image Segmentation (EBHI-Seg) dataset using the Synthetic Minority Over-sampling Technique (SMOTE), key feature selection using a Chisquare test, classification by machine learning algorithms, and improving classification accuracy through hyperparameter tuning. Finally, the results evaluated on the available EBHI-Seg dataset achieve 97.28% accuracy, 97.29% precision, 97.27% recall, 96.27% F1- score, and 99.4% area under the curve (AUC), demonstrating that the suggested model is superior to other methods already in use.
  4. Hybrid Deep Learning Approach: CNN-ViT Fusion for Breast Cancer Diagnosis in Ultrasound Images
    1403
    Breast cancer represents one of the leading cancer diagnoses in women around the world. Early detection and accurate classification of breast cancer from medical images are crucial, as they enable timely treatment, which can significantly improve patient outcomes. Ultrasound imaging is a popular diagnostic method in radiology for evaluating breast health. Over the past ten years, deep learning approaches, especially Convolutional Neural Networks (CNNs), have been used to develop comprehensive systems for recognizing image patterns. More recently, the Vision Transformer (ViT) has gained attention as a novel deep learning architecture, largely because of its self-attention mechanisms, which have greatly improved the field of image processing. These models have exhibited strong performance across a wide range of image-related applications. Computer-Aided Diagnosis (CAD) systems in medical field have increasingly adopted deep learning methodologies, recognized for their superior ability to extract essential features from medical images. This study proposes a hybrid deep learning approach that integrates CNNs with ViTs to enhance breast cancer diagnosis in ultrasound images. This method capitalizes on the beneficial attributes of CNNs and ViTs to boost the accuracy of breast cancer diagnosis. By combining the powerful local feature extraction ability of CNNs with ViTs focus on long-range dependencies and global features, the hybrid network, integrating multiple vision architectures, optimizes the utilization of information, enabling a more thorough and nuanced interpretation of medical imaging data. The methodology was assessed using two publicly accessible datasets, revealing superior performance compared to current state-of-the-art techniques. This indicates that our method has the potential to generalize across various datasets. The high accuracy achieved by this hybrid deep learning model suggests that it can play a significant role in improving breast cancer diagnosis.
  5. روش یادگیری عمیق چندوجهی مبتنی‌بر توجه برای شرح تصویر
    1403
    مغز ما قادر است تصاویری که در برابرمان ظاهر می‌شوند را توصیف و یا دسته‌بندی کند. اما چگونه یک کامپیوتر می‌تواند تصویر را پردازش کرده و آن را با یک شرح مناسب و دقیق شناسایی کند؟ این امر چند سال پیش غیرقابل دستیابی به نظر می‌رسید، اما با پیشرفت الگوریتم‌های بینایی ماشین و یادگیری عمیق، همچنین در دسترس بودن مجموعه داده‌ها و مدل‌های هوش مصنوعی مناسب، ساخت یک تولیدکننده شرح مناسب برای یک تصویر آسان‌تر شده است. تولید شرح تصویر همچنین یک صنعت رو به رشد در سراسر جهان است. فرایند تولید شرح تصویر برای تبدیل تصاویر به یک سری کلمات با استفاده از یک سری پیکسل‌ها استفاده می‌شود. می‌توان تصور کرد که تولید شرح تصاویر چالشی از ابتدا تا انتها در قالب یک چالش توالی به توالی است. برای دستیابی به این هدف، لازم است هم کلمات و هم تصاویر را پردازش کرد. در این پایان نامه، ابتدا، توضیحی از شرح تصویر و کاربردهای آن در حوزه‌های مختلف ارائه شده است و سپس، به بررسی سیر تکاملی روش‌های شرح تصویر پرداخته شده است. روش‌های مختلفی که در گذر زمان برای شرح تصویر پیشنهاد شده‌اند، به‌طور جامع مورد بررسی قرار گرفته‌اند. این دسته‌بندی منسجم به ما کمک می‌کند تا به فهم عمیق‌تری از تکنیک‌ها و روش‌های موجود در شرح تصویر برسیم. همچنین، در این پایان نامه مقالات اخیر در حوزه شرح تصویر مورد بررسی قرار گرفته‌اند. با توجه به نتایج بدست آمده از بررسی مقالات اخیر، ضرورت ادامه پژوهش‌ها در حوزه شرح تصویر مورد تاکید قرار گرفته است. این پژوهش‌ها می‌توانند بهبودهای مهمی در روش‌های موجود برای شرح تصویر و نیز کشف روش‌های نوین و پیشرفته‌تر منجر شوند. در این پایان نامه از روش رمزگذار-رمزگشا مبتنی‌بر توجه استفاده شده است که برخلاف روش‌های پیشین که توجه فقط برروی یکی از بخش‌ها اعمال می‌شد، مکانیسم توجه هم برروی تصویر و هم برروی متن اعمال شده است که این یک ایده جدید در این حوزه می‌باشد و همچنین شیوه تولید شرح نهایی لغت به لغت است. از مجموعه داده FLICKR8K استفاده شده است و همچنین از معیار های ارزیابیBLEU (1,2,3,4) ، ROUGE، METEOR استفاده شده است.که این نتایج به ترتیب، 51_49_48_44_52_37.5 است. این نتایج به دست آمده حاکی از بهبود روش‌های قبلی است.
  6. طبقه بندی متن کردی با استفاده از یک الگوریتم بهینه سازی
    1402
    امروزه با افزایش روزافزون اطلاعات و گستردگی موضوعات، طبقه‌بندی متون یکی از چالش‌های هوش مصنوعی است. طبقه‌بندی متون شاخه‌ایی از پردازش زبان طبیعی است که در آن‌ها متون در دسته‌ها یا گروه‌هایی قرار می‌گیرند. طبقه‌بندی متون یکی از مواردی است که اخیرا مورد توجه قرارگرفته است و کاربرد‌های بسیاری دارد، از جمله مهمترین آنها، دسته‌بندی اسناد، بازیابی اطلاعات، پرسش ‌و پاسخ، قطبیت‌سنجی و ... می‌باشد. زبان کردی یکی از شاخه‌های هندو-ایرانی زبان‌های هندو-اروپایی است که بیش از 30 میلیون نفر در آسیای غربی، عمدتاً در عراق، ترکیه، ایران، سوریه، ارمنستان و آذربایجان به آن صحبت می‌کنند. زبان کردی دارای گویش های متنوعی است و دارای سیستم دستوری و واژگان غنی مختص به خود است. اکثر سیستم‌های طبقه‌بندی متن را می‌توان به چهار مرحله خلاصه کرد: استخراج ویژگی، کاهش ابعاد، انتخاب طبقه‌بندی کننده و ارزیابی. در ابتدا از یک متن، استخراج ویژگی (با استفاده از کد کردن کلمات) به روش‌های مختلف صورت می‌گیرد. ازآنجا که اغلب ویژگی‌های استخراج شده اضافی و بی‌ربط هستند، می‌توانند باعث خطا در طبقه‌بندی‌کننده شوند. سپس انتخاب ویژگی‌های مهم‌تر، به‌عنوان یک مشکل اساسی در طبقه‌بندی متون، مطرح است. انتخاب ‌ویژگی‌های مهم از تمام ویژگی‌ها، نقش به سزایی درافزایش کارایی دقت طبقه‌بندی دارد. در این مرحله ما با استفاده از روش‌های یادگیری ماشین سعی در انتخاب بهترین ویژگی‌ها داریم که این امر، بر روی مجموعه دادگان متنی زبان کردی صورت می‌پذیرد. از جمله روش‌های یادگیری ماشین در مسئله‌های بهینه‌سازی، استفاده از الگوریتم‌های فراابتکاری است. الگوریتم‌های فراابتکاری بسیاری تا امروز معرفی شده‌اند که هرکدام الهام گرفته از طبیعت هستند. این الگوریتم‌ها فرضیات کمی در مورد یک مسئله ایجاد می‌کنند و یا می‌توانند فضاهای بسیار بزرگی از راه‌حل‌های کاندید را جستجو کنند. الگوریتم مرغ تخم‌گذار از جمله یکی از بهترین الگوریتم‌های فراابتکاری در حل مسائل بهینه‌سازی در فضای پیوسته است. با استفاده از الگوریتم فراابتکاری مرغ تخم‌گذار ویژگی‌های استخراج شده از متن طوری انتخاب می‌گردند که دقت طبقه‌بندی کننده افزایش یابد. بدین منظور ابتدا نسخه‌ای پیشرفته از این الگوریتم در فضای گسسته ارائه می‌شود و سپس در فضای نمونه تمام حالات انتخاب ویژگی، جایگذاری می‌شوند. الگوریتم با پیمایش فضای نمونه و ارزیابی نقطه به نقطه‌ی حالات، از نقطه‌ای به نقطه‌ی بهتر حرکت می‌کند. چالش اصلی این کار انتخاب نقطه‌ای خوب برای شروع و انتخاب درست محدوده تغییر برای هر نقطه است. ما در این پژوهش به یکی از بهترین روش‌ها برای بهبود انتخاب ویژگی در وظیفه‌ی طبقه‌بندی متن دست یافته‌ایم که روشی جدید است. از طرفی با پیاده‌سازی این روش بر روی زبان کردی (که جزو زبان‌های کم منبع در پردازش زبان طبیعی محسوب می‌شود) پژوهش خود را غنی‌تر ساخته‌ایم. نتایج این پژوهش در مقیاس کم (با توجه به کمبود منابع پردازشی) بهبود یک درصدی در دقت طبقه‌بندی کننده را نشان می‌دهد که نشان از کارایی رویکرد ارائه شده دارد و دری تازه بر روی پژوهشگران عزیز باز می‌کند.
  7. کنترل اتوماتیک تولید با استفاده از سیستمهای چند عامله
    1388
    در این پایان نامه، از کنترل کننده های هوشمندی استفاده شده است که در ساختار آن ها، از استانداردهای عملکرد کنترل بهره گرفته شده است تا علاوه بر کنترل مناسب بار-فرکانس، از این استانداردها پیروی کنند. نتایج نشان داد با به کارگیری استانداردهای عملکرد در ساختار کنترل کننده، عملکرد کنترل کننده در برآوردن اهداف کنترلی از جمله کاهش زمان نشست و فراجهش بهبود می یابد. در این پایان نامه، علاوه بر استفاده از الگوریتم های کلاسیک، از کنترل کننده مبتنی بر سیستمهای چندعامله و با لحاظ کردن استانداردهای عملکرد استفاده شد تا هم از فرسودگی تجهیزات گاورنر کم کند و هم از استانداردهای عملکرد NERC پیروی کرده تا قابلیت اطمینان را افزایش دهد. نتایج نشان می دهد که کنترل کننده هایی که از استانداردهای NERC پیروی می کنند، عملکرد مناسب تری داشته و پاسخ فرکانسی آن ها بهبود یافته است.