یک شبیه سازی برای تجزیه و تحلیل روش انتخاب ویژگی با استفاده از آنتولوژی ژنی برای طبقه بندی بیان ژن / A simulation to analyze feature selection methods utilizing gene ontology for gene expression classification

یک شبیه سازی برای تجزیه و تحلیل روش انتخاب ویژگی با استفاده از آنتولوژی ژنی برای طبقه بندی بیان ژن A simulation to analyze feature selection methods utilizing gene ontology for gene expression classification

  • نوع فایل : کتاب
  • زبان : فارسی
  • ناشر : الزویر Elsevier
  • چاپ و سال / کشور: 2013

توضیحات

رشته های مرتبط: زیست شناسی، بیوانفورماتیک، میکروبیولوژی، ژنتیک و علوم سلولی و مولکولی
۵٫ خلاصه و نتایج این مطالعه ی به بررسی این سوال میپردازد که چه زمانی باید از روش گزینش مشخصه ی مبتنی بر GO به طور موثر استفاده کرد ، در حالی که مطالعه های قبلی روش های را برای چگونگی استفاده از این روش ارائه کرده اند. برای بررسی این سوال ، ما یک شبیه سازی را ایجاد کردیم. گام اول شبیه سازی الگوریتم ۱ است که مجموعه ای از ژن ها را به عنوان خروجی تحویل میدهد. این ژن ها به طور متفاوتی بین یک طبقه کنترلی و یک طبقه ی آزمایشی بیان شده اند. این مجموعه از ژن ها نشان دهنده ی یک حالت زیستی است که با ∆ نشان داده میشود. ما داده های بیان ژنی مصنوعی را با استفاده از داده های واقعی جمع آوری شده از سلول های پوششی مسیر هوایی به دست آورده ایم. داده ها از طبقه ی آزمایشی ( نشان دهنده ی شرایط زیستی تغییر یافته ) بر گروه کنترلی مبتنی است ، به غیر از ژن هایی که در مجموعه ی ∆ هستند و بیانشان افزایش و یا کاهش یافته است. دامنه ی افزایش و یا کاهش ها در توسط پارامتر کنترل میشود. دو مجموعه داده ها شامل حالت های بنیادی روند های تولید داده هستند که نمونه هایی جدید با نویز جدید را ایجاد میکند. ما دوطبقه بندی کنندهی DLDA را روی داده های تولید شده از این ژن های اولیه تمرین میدهیم. یک طبقه بندی کننده از ویژگی های آماری برای انتخاب ژن ها استفاده میکند و طبقه بندی کننده ی دیگر از ویژگی های آماری در ارتباط با شباهت های معنایی در GO برای گزینش ژن ها استفاده میکند. ما یک اندازه گیری را به نام معرفی میکنیم که سطح تفسیر را کمی سازی کرده و یا همبندی ژن ها و عبارات را در یک حالت زیستی نشان میدهد.

Description

This study addresses the question of when to use GO-based feature selection effectively, whereas previous studies have developed methods on how to use GO effectively for feature selection. To investigate this question, we created a simulation. The first step of the simulation process is Algorithm 1, which outputs a set of genes. These genes are differentially expressed between a control class and an experimental class. This set of genes represents a biological condition, and is denoted by D. We generate synthetic gene expression data using real data collected from large airway epithelial cells. The data from the experimental class (representing an altered biological condition) is based on the control class, except the genes that are in the set D have their expression either increased or decreased. The magnitude of increase or decrease for each gene in D is governed by the parameter d. These two datasets constitute the seed of our data generation process, which generates new samples with additional noise. We train two DLDA classifiers on data generated from these seed datasets. One classifier uses only statistical properties to select genes, and the other classifier uses statistical properties in conjunction with semantic similarity in GO to select genes. We define a measure called BCAL(G), which quantifies the annotation level, or connectedness of the genes and terms, in a biological condition.
اگر شما نسبت به این اثر یا عنوان محق هستید، لطفا از طریق "بخش تماس با ما" با ما تماس بگیرید و برای اطلاعات بیشتر، صفحه قوانین و مقررات را مطالعه نمایید.

دیدگاه کاربران


لطفا در این قسمت فقط نظر شخصی در مورد این عنوان را وارد نمایید و در صورتیکه مشکلی با دانلود یا استفاده از این فایل دارید در صفحه کاربری تیکت ثبت کنید.

بارگزاری