Motif Discovery
Introduction
Pattern discovery algorithms are one way to uncover biological truths hidden in the massive amounts of sequence and gene expression data available. Sequence motifs are important in the understanding of protein structure and function, genetic regulation and proteinprotein, protein-nucleotide interactions.
Types of motifs and what they mean
Motifs in protein sequences Structure, function, evolution Motifs in DNA and RNA sequences Promoters, transcription factor binding sites, splicing signals
Motifs in Protein Sequences
The leucine zipper may explain how some eukaryotic gene regulatory proteins work. L-x(6)-L-x(6)-L-x(6)-L The leucine side chains extending from one alphahelix interact with those from a similar alpha helix of a second polypeptide, facilitating dimerization
Motifs in DNA Sequences
Motifs in DNA Sequences
Promoter regions, e.g. TATA box Transcription factor binding sites, e.g. Eve in Drosophila:
G-G-T-C-C-T-G-G
Cis-Regulatory regions
Motifs in RNA sequences
Human RNAsplice junctions sequence matrix
http://www-lmmb.ncifcrf.gov/~toms/sequencelogo.html
Motifs in Protein Structures
Protein structure patterns can encode information about protein function. Structure motifs can be used to improve multiple alignments of protein sequences.
motif
motif
gap insert
BCTERIALGSPC1 Length of motif = 10 PCODE LNLSLTGVMA LNAQLNGVLA LNAQLNGVLA LNLSLTGVMV LNISLTGVLA LSLVLSGVVA GSQC_ERWCH GSPC_AERHY GSPC_AERSA GSPC_ERWCH GSPC_ERWCA GSPC_VIBCH Motif number = 1 ST 93 108 108 93 104 110 INT 93 108 108 93 104 110 General secretion pathway protein C motif I - 2
The Three Elements of Pattern Discovery
Pattern discovery requires: A pattern language This defines what kind of patterns you can find. An objective function This defines what makes a pattern "interesting". An algorithm This defines how to search among the possible patterns to find the "interesting" ones.
- proteinsimple > protein-nucleotide
-
protein-nucleotide
下载该文档 文档格式:PDF 更新时间:2006-11-01 下载次数:0 点击次数:1
文档基本属性 文档语言: Simplified Chinese 文档格式: pdf 文档作者: 微软用户 关键词: 主题: 备注: 点击这里显示更多文档属性 经理: 单位: 微软中国 分类: 创建时间: 上次保存者: 修订次数: 编辑时间: 文档创建者: 修订: 加密标识: 幻灯片: 段落数: 字节数: 备注: 演示格式: 上次保存时间:
- 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
-
PDF格式下载
- 更多文档...
-
上一篇:protein-encoding
下一篇:tetrazole-protein
点击查看更多关于proteinsimple的相关文档
- 您可能感兴趣的
- protein apolipoprotein predictprotein uniprotein glycoprotein protein是什么意思 lipoprotein proteorhodopsin novoprotein ribonucleoprotein
- 大家在找
-
- · 数据结构课后习题答案
- · 安慰去世家属短信
- · 北影杨幂05班
- · 天津冲压件
- · 常州工程职业技术学院
- · 园林景观手绘
- · 维修工考试试题
- · 新还珠格格吻戏
- · 美的电子鞋柜
- · 怎样使用autocad绘图
- · 高频电子电路课本
- · 香港大学2012博士招生
- · 西方经济学学习体会
- · 会计人员的职业能力
- · directx8.11ù·
- · datavaluefield
- · 北京兰格钢材网
- · ufo清晰外星人2012
- · 怎样根除头痒头皮屑
- · 免费下载平面制图软件
- · 华擎z68pro3
- · 2011考研英语真题
- · 拆卸office2007补丁
- · 长生不死小说下载
- · plc电梯毕业论文设计
- · 有源PFC电路
- · 八阿哥重生父子文
- · 旅行不是为了目的地
- · 高一数学集合练习题
- · 草柳社社区2012年04
- 赞助商链接