棒棒糖圖是直觀顯示蛋白質(zhì)結(jié)構(gòu)上的突變點(diǎn)**簡(jiǎn)單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優(yōu)先位點(diǎn)。這些位點(diǎn)被認(rèn)為是突變熱點(diǎn),棒棒糖圖可以用于顯示突變熱點(diǎn)以及其他突變位點(diǎn)。并可以對(duì)比不同**/亞型的突變位點(diǎn)。
基本原理
將蛋白質(zhì)結(jié)構(gòu)根據(jù)氨基酸順序繪制為長(zhǎng)條形,以不同色塊標(biāo)注不同結(jié)構(gòu)域,在基因突變導(dǎo)致氨基酸改變的位置標(biāo)注棒棒糖,并在棒棒糖圓球標(biāo)注位點(diǎn)的突變頻數(shù)以及突變位點(diǎn)。
數(shù)據(jù)要求
基因突變或者蛋白質(zhì)突變數(shù)據(jù)
下游分析
1、突變位點(diǎn)靶向藥物分析
2、驅(qū)動(dòng)基因突變分析 診療軟件開發(fā)、算法還原與開發(fā)、臨床統(tǒng)計(jì)等數(shù)據(jù)科學(xué)工作。廣東臨床統(tǒng)計(jì)數(shù)據(jù)科學(xué)售后服務(wù)
術(shù)語(yǔ)解讀:PPI:蛋白質(zhì)-蛋白質(zhì)相互作用(protein-proteininteraction)PPImoduleI:指蛋白質(zhì)相互作用模塊,一個(gè)模塊指向一個(gè)功能數(shù)據(jù)要求:基因列表應(yīng)用示例1:(于2018年3月發(fā)表在Immunity.,影響因子)T細(xì)胞活化過程中產(chǎn)生蛋白質(zhì)組進(jìn)行多重定量分析,然后對(duì)差異表達(dá)蛋白權(quán)重聚類,并將聚類蛋白疊加到PPI網(wǎng)絡(luò)上以識(shí)別功能模塊。D.模塊大小的分布,通過將每個(gè)WPC(權(quán)重聚類結(jié)果)中的蛋白疊加到蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)上識(shí)別模塊。每個(gè)模塊的蛋白質(zhì)數(shù)量顯示出來。E.各個(gè)模塊及其交互的關(guān)系圖。圓圈(節(jié)點(diǎn))表示90個(gè)模塊,圓圈大小與模塊大小成比例。邊連接共享PPIs的模塊。在(F)和(G)中進(jìn)一步擴(kuò)展了裝箱模塊。F.來自WPC3的細(xì)胞質(zhì)和線粒體核糖體的四個(gè)互連模塊。顯示了蛋白質(zhì)的名稱和每個(gè)模塊的代表性功能術(shù)語(yǔ)。G.來自WPC3的蛋白酶體,OXPHOS和線粒體復(fù)合物IV途徑的模塊。 重慶文章成稿指導(dǎo)數(shù)據(jù)科學(xué)服務(wù)利用甲基化數(shù)據(jù)分析樣本的拷貝數(shù)變異。
三角坐標(biāo)統(tǒng)計(jì)圖是采用數(shù)字坐標(biāo)形式來表現(xiàn)三項(xiàng)要素的數(shù)字信息圖像。三角形坐標(biāo)圖常用百分?jǐn)?shù)(%)來表示某項(xiàng)要素與整體的結(jié)構(gòu)比例。三條邊分別表示三個(gè)不同分量,三個(gè)頂點(diǎn)可以看作是三個(gè)原點(diǎn)。三角圖可以展示某特定值在一個(gè)整體中不同類型的分布。在生物信息中三角圖可以方便地展示3種不同疾病或者3個(gè)不同分組之間某個(gè)指標(biāo)的相關(guān)性。
數(shù)據(jù)要求
多個(gè)樣本的三個(gè)變量值,或者多個(gè)基因在三個(gè)不同分組中的數(shù)據(jù)值,可以是突變頻率數(shù)據(jù)、基因表達(dá)數(shù)據(jù)、甲基化數(shù)據(jù)等。
ROC機(jī)器學(xué)習(xí)受試者工作特征曲線(receiveroperatingcharacteristiccurve,簡(jiǎn)稱ROC曲線),又稱為感受性曲線(sensitivitycurve),是用來驗(yàn)證一個(gè)分類器(二分)模型的性能的。一般應(yīng)用于直觀展示敏感性和特異性連續(xù)變量的綜合指標(biāo),如比較多個(gè)biomarker或臨床參數(shù)的診斷表現(xiàn)、比較多個(gè)算法的分類效果?;驹鞷OC曲線工作原理是,向模型中輸入已知正負(fù)類的一組數(shù)據(jù),對(duì)比模型對(duì)該組數(shù)據(jù)的預(yù)測(cè),衡量這個(gè)模型的性能。術(shù)語(yǔ)解讀:1、TP(TruePositive,真正,TP)被模型預(yù)測(cè)為正的正樣本(原來為正預(yù)測(cè)為正)2、TN(TrueNegative,真負(fù),TN)被模型預(yù)測(cè)為負(fù)的負(fù)樣本(原來為負(fù)預(yù)測(cè)為負(fù))3、FP(FalsePositive,假正,FP)被模型預(yù)測(cè)為正的負(fù)樣本(原來為負(fù)預(yù)測(cè)為正)4、FN(FalseNegative,假負(fù),FN)被模型預(yù)測(cè)為負(fù)的正樣本(原來為正預(yù)測(cè)為負(fù))5、真正類率(TruePostiveRate)TPR:TP/(TP+FN),**分類器預(yù)測(cè)的正類中實(shí)際正實(shí)例占所有正實(shí)例的比例。Sensitivity6、假正類率(FalsePostiveRate)FPR:FP/(FP+TN),**分類器預(yù)測(cè)的負(fù)類中預(yù)測(cè)為正實(shí)例(實(shí)際為負(fù)實(shí)例)占所有負(fù)實(shí)例的比例。1-Specificity7、真負(fù)類率(TrueNegativeRate)TNR:TN/(FP+TN)。 糖尿病藥物基因組學(xué)分析找到新的作用靶點(diǎn)。
bubbles(不同分組的基因表達(dá)或通路富集展示):Bubbles可以同時(shí)展示pvalue和表達(dá)量。例如展示motif的pvalue和motif對(duì)應(yīng)的轉(zhuǎn)錄因子的表達(dá)量,方便快速看出轉(zhuǎn)錄因子富集且高表達(dá)所在的group,預(yù)示著該分組對(duì)細(xì)胞狀態(tài)的改變(例如細(xì)胞分化、轉(zhuǎn)移、應(yīng)激)起關(guān)鍵調(diào)控作用;例如做基因功能富集分析時(shí),展示富集的通路qvalue和基因數(shù)量或geneRatio。
基本原理:
Bubbles的實(shí)質(zhì)是分組數(shù)據(jù)下基因表達(dá)量或通路內(nèi)基因數(shù)量的可視化,同時(shí)可以展示pvalue。
數(shù)據(jù)要求:
表達(dá)矩陣,分組 早期肝疾病的預(yù)后基因panel研究。天津算法還原與開發(fā)數(shù)據(jù)科學(xué)專業(yè)服務(wù)
目前能夠?qū)映^50家實(shí)驗(yàn)室。廣東臨床統(tǒng)計(jì)數(shù)據(jù)科學(xué)售后服務(wù)
industryTemplate廣東臨床統(tǒng)計(jì)數(shù)據(jù)科學(xué)售后服務(wù)