DNA甲酰基胞嘧啶(5fc)修飾測序

  • 簡介
  • 實驗流程
  • 優勢
  • 結果展示
  •       DNA甲酰基胞嘧啶修飾(5fc)是DNA去甲基化過程中的中間產物,也被稱為第七堿基,在生物體中穩定存在,在表觀遺傳中發揮著重要作用。研究報道,5fc在增強子中高度富集,這暗示5fc調控基因的轉錄和表達。5fc可以特異的結合特定的蛋白,參與到表觀遺傳調控。同時5fc可以影響DNA的雙螺旋結構,有研究顯示,5fc在前列腺癌的發生發展過程中起著不可替代的作用。以上研究表明,5fc不僅僅作為DNA去甲基化的中間產物,還在多種生物學過程中發揮重要作用,可作為新的疾病標誌物。



    Figure 1:DNA去甲基化過程及各中間產物的功能


    數譜生物(原2022世界杯竞猜app下载生物)為您提供一站式DNA甲酰基胞嘧啶(5fc)修飾測序技術服務,您隻需要提供保存完好的組織或細胞標本,我司就可以為您完成從DNA提取、5fc DNA富集、文庫構建、高通量測序到數據分析的一整套服務,並提供完整的實驗報告。


  • 圖釋:DNA甲酰基胞嘧啶(5fc)修飾測序流程示意圖

          用普通的葡萄糖在bGT催化作用下將內源的5hmC葡糖基化,然後在NaBH4作用下將5fC還原成5hmC。使用5hmC選擇性的化學標記方法(hMe-seal)特異性富集從5fc還原產生的5hmC,進行測序。

  • 高度特異性: 本方法可以從DNA修飾中特異性識別5fC。


    圖釋:分別對加入了含有2種不同修飾的spike in(分別為5 hmC和5fc)的DNA樣品(20 g)進行富集試驗,富集完成後進行PCR檢測,結果顯示該方法具有良好的5fc富集特異性。



    無密度偏好性: 本方法富集5fc區域不依賴於DNA修飾的表達水平。

    穩定性高:實驗操作穩定性高,減少實驗操作帶來的誤差。

    靈活度高:能夠直接對有基因組信息的任意物種的DNA 5fc進行測序。

    精確度高:能夠在實際結合位點50個堿基範圍內精確定位。

    提供文章發表級別的數據可視化圖譜

  • 1. peak識別及注釋

    我司使用MACS2進行peak識別,並根據Ensembl數據庫和Ehancer數據庫(EnhancerAtlas)的注釋信息,對peak進行詳細注釋。

    (1)Peak分類

    根據peak頂點與轉錄本的相對位置關係對peak進行分類,具體分類方法如下。



    Figure1. peak分類


    Table1. 各樣本peaks區域


    (2)peak統計

    根據以上分類,對不同區域進行統計繪製餅狀圖。

    Figure2. peak統計圖(TFBS: 轉錄因子結合位點)


    對peaks和fragments在TSS(轉錄起始位點)及轉錄本周圍的分布情況進行統計並繪圖。

     

    (a)Peaks密度在TSS周圍的分布   (b) Peaks密度在轉錄本周圍的分布

    (c)標準化後的reads在TSS周圍的分布   (d) 標準化後的reads在轉錄本周圍的分布

    Figure3. peak分布情況


    修飾密度(peaks/C)用來展示修飾區域在整個染色體上的分布情況;將修飾水平分為低(0%~30%,綠色),中(30%~70%,藍色),高(70%~100%,紅色)三類,在Circos圖中進行展示(bin=1Mbp)。

    Figure4. 修飾密度在不同染色體上的分布 

    Figure5. 不同修飾水平peaks在染色體上的分布


    2. 差異peak分析

    2022世界杯竞猜app下载生物丨數譜生物使用DiffBind進行組間或樣本間比較的差異peak分析,並根據Ensembl數據庫和Enhancer數據庫(EnhancerAtlas)進行差異peak注釋。

    Table2. 差異peak區域


    根據差異peak注釋到的不同區域,對區域數量進行統計繪製條形圖,並以10kb為單位對peak在染色體上的分布進行統計並繪圖。


    Figure6. 差異peak統計展示  (左):差異peak分布統計圖; (右):差異peak染色體分布圖



    通過各樣本在差異peak富集程度的係統聚類分析,可以了解各組樣本間的關係。火山圖通過-log10P_value和log2Fold_Change兩個條件,對比較數據進行篩選,可以直觀地展示兩組數據之間富集差異的倍數變化及顯著性的關係。


    Figure 7. 差異peak聚類圖和火山圖 (左):聚類圖; (右): 火山圖



    3.差異peak的GO & KEGG富集分析

    (1)差異peak的GO富集分析

    GeneOntology (GO)是一種基因功能分類條目,有三個子條目,分別描述每個基因的分子功能(MF: Molecular function)、細胞組成(CC: Cellular component)、參與的生物學過程(BP: Biological process)。通常的GO富集分析就是利用統計學算法來找出一組差異表達基因和哪些具體功能條目聯係最大,每個GO條目都對應一個統計值P-value來表示顯著性,P-value越小表示該GO條目和輸入的差異表達基因聯係越大,即該組差異表達基因大部分具有該GO條目對應的描述功能。

    Table3. GO富集分析結果



    Figure 8. GO富集結果圖 (左):各GO條目中出現的基因數;(右)MF、CC、BP前十富集條目柱狀圖



    (2)差異peak的Pathway富集分析

    根據KEGG database (Kyoto Encyclopedia of Genes and Genomes)中的生物學通路分類條目,來找出一組差異表達基因和哪些具體的功能條目聯係最大。每個Pathway條目都對應一個統計值P-value來表示顯著性,P-value越小表示該GO條目和輸入的差異表達基因聯係越大,即該組差異表達基因P-value越小表示該Pathway條目和輸入的差異表達基因聯係越大。

    Table 4. KEGG富集分析結果


    Figure 9. KEGG富集結果圖



    4. Motif分析

    在遺傳學中,motif是指一段短的且普遍存在的核苷酸或氨基酸序列。被認為有特定的生物學意義,比如DNA上的蛋白結合位點。當motif出現在基因外顯子區域時,其對蛋白結構具有重要作用。我司使用MEME-ChIP(v4.9.1)中的DREME方法(適合於查找短的motif)來檢測motif。將得到的motif與轉錄因子結合位點motif數據庫(JASPARCORE2018)內的motif進行比較,從而得到相關motif的更多信息。

    Table 5. Motif比較結果


    Figure 10. Motif結果圖 (左):Motif結果圖;(右)左圖中序列反向互補圖



    5. 比對結果可視化

    我司將測序數據儲存為bedGraph文件,可以在IGV或UCSC基因組瀏覽器中查看。

    Figure 11. 比對結果可視化