亚洲婷婷免费_区一区二区三区中文字幕_欧美做受高潮电影o_日韩av电影免费在线_国产精品麻豆入口_无码国产精品96久久久久_99热在线免费_成人性生交大片免费看午夜_成人高清av_欧美三级免费

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

前沿科技 3年前 (2022) 虛像
1 0 0
你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

1 TB 數(shù)據(jù)存儲成本 8 億美元,還是有點高。

作者 | 凌梓郡編輯 | 靖宇

恐龍滅絕 6000 多萬年后,科學家們獲得了一塊史有前蚊子的琥珀,從蚊子血中獲得了恐龍的基因,從而讓遙遠的生物復活。講這個故事的《侏羅紀公園》,至今仍位列全球電影票房前十。這個系列故事的原理很簡單:DNA 存儲了恐龍的生物信息,科技讓它重新表達。

現(xiàn)在,用 DNA 想象另一個故事:在宇宙長河中,「人類世紀」也寂滅了。另外一種智慧生物出現(xiàn),TA 們去探究遠古的「人類文明」。有什么會承載人類文明的記憶?氣溫異變,地球上的龐大數(shù)據(jù)中心徒留遺跡。

而凍土中有一份 DNA,它很輕,只有 1 公斤,看起來是一些被封裝在膠囊里的白色粉末。讀取后,里面卻記載了地球上曾有的巨量信息。視頻、文字、代碼展現(xiàn)了人類歷史進程中的無數(shù)發(fā)明和文藝作品。于是那個遙遠文明的痕跡在宇宙間再次展開。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

這是另一個科幻設定了。背后的技術正是目前被關注的一個前沿方向:DNA 存儲信息。在大自然里,DNA 負責存儲遺傳信息。單個人體細胞的平均直徑是 5 到 200 微米,這其中的 DNA 可以包含一個人全部的遺傳信息:30 億對堿基。

那為什么不能用堿基存儲別的信息?這個科幻般的設想,正在走出實驗室,被當作信息存儲的未來方案。

01

基因組數(shù)據(jù)太多了,

怎么辦?

本來是生物學家想解決生物學發(fā)展的問題。

11 年前,一群生物信息學家在德國的一家酒店里討論「數(shù)據(jù)存儲問題」。Nick Goldman 也在其中,那是他在歐洲生物信息所(EBI)擔任高級科學家的第二年。

大規(guī)模的基因組測序正在進行,隨之產生的數(shù)據(jù)規(guī)模快速增長。存儲、壓縮這些數(shù)據(jù)是個麻煩事,現(xiàn)有的技術方案看起來不太行。據(jù)估計:人類基因組需要高達 2-40EB 的存儲容量。這可能超過一個世界級科技公司的云存儲量——全世界蘋果用戶存儲在谷歌云上的數(shù)據(jù)總量大約是 8 EB。這 8EB 數(shù)據(jù),每月存儲費需要 2.18 億美元。(1EB= 102^3GB )

生物學家們陷入了沮喪。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

Nick Goldman 拿著存儲了莎士比亞所有十四行詩、一張照片和「我有一個夢想」演講片段的 DNA| 來源:EBI

有人靈光乍現(xiàn):是什么東西阻止了我們用 DNA 來儲數(shù)據(jù)呢?

看起來是一句玩笑話,但是生物學家們意識到了這不僅僅是個玩笑,他們拿起手邊的餐巾紙,用圓珠筆認真計算起可行性。

DNA 存儲遺傳信息的原理并不復雜,它由四種核苷酸 A、T、G、C 組成,彼此兩兩對應,組成雙螺旋結構。核苷酸的序列,記錄了遺傳信息。

在數(shù)字世界,所有的信息本質上是 0 和 1 組成的數(shù)據(jù)串。想要 DNA 存儲數(shù)字信息,簡單理解,原就是將 0 和 1 的編碼序列轉換成核苷酸的序列。DNA 存儲的優(yōu)勢在于密度大,大約在你眼前逗號這么大小,1 立方毫米的 DNA,就可以容納 9TB(1TB=1024GB)的信息。

用 DNA 存儲數(shù)據(jù),也并不是完全新的想法,之前就有科學家嘗試過。不過屬于科學和藝術的先鋒跨界實驗。

1988 年,藝術家 Joe Davis 和哈佛大學的研究員,將一副名為「小維納斯」(Micro Venus)的圖案存儲到 DNA 短鏈中。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

存儲進 DNA 的小維納斯(microvenus)圖片 來源:相關論文

這個圖案編碼簡易,白色的地方標記為 0、黑色的線條部分標記為 1,文件大小只有 35bits,用了 28 個核苷酸長度的 DNA 鏈條來存儲。

在那次酒店討論的 2 年之后,2013 年,Goldman 團隊發(fā)表了研究成果。這次,他們存儲了 5 種不同格式的文件,一共有 0.75MB。為了確保信息讀取不出錯,科學家存儲的時候,每份信息按照四倍冗余的量來存儲。

五個文件分別是:

•154 首莎士比亞的 14 行詩(ASCII 編碼格式)

• 提出 DNA 雙螺旋結構的論文(PDF 版)

• 一張照片(JPEG 格式)

• 馬丁 · 路德金「我有一個夢想」演講其中 26 秒片段(MP3 格式)

• 一串霍夫曼密碼

這些年,DNA 存儲容量的上線不斷被突破。2019 年,美國一家創(chuàng)業(yè)公司 Catalog 在 DNA 中存儲了 16GB 的維基百科。這個公司表示自己正在建設世界上第一個基于 DNA 的大規(guī)模數(shù)字數(shù)據(jù)存儲和計算平臺。

02

編碼和解碼,

要處理的事情很多

在一些生物學家看來,用 DNA 來存儲是一件非?!疙樆沟氖??!复笞匀坏木幋a語言非常類似于我們在計算機領域使用的二進制語言。在硬盤上我們使用 0 和 1 來代表數(shù)據(jù),而 DNA 中,我們擁有 4 種形式的核苷酸,A、C、T 和 G」。在瑞士聯(lián)邦理工學院的生物學家 Robert Grass 說。

DNA 存儲的關鍵之一是用四個核苷酸去映射 0 和 1 兩個數(shù)字。方案可以很簡單。比如:A 對應 00,C 對應 01,G 對應 10,T 對應 11。然后再按照所需要的核苷酸序列,像串珠子一樣,把核苷酸們串成一串。(這就是 DNA 合成)需要讀取信息的時候,再運用基因測序技術,把這一串核苷酸序列讀取出來,再翻譯成 0 和 1 的字符串。這個流程就是編碼— DNA 合成—測序—解碼。

這個聽起來像是「把大象裝進冰箱」的流程,操作起來需要考慮的問題還有很多。不然科學家就不必一直研究新的編碼方案了。

在自然界存在的 DNA 中,A 和 T,C 與 G 兩兩配對,在一條 DNA 中,CG 與 AT 的存在比例基本均勻,為 50% 左右。如果 C 和 G 的含量過高,可能會讓 DNA 鏈產生一些復雜的物理結構。這就會讓 DNA 測序(解碼)變得復雜。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

DNA 存儲的步驟| 來源:DNA Data Storage Alliance

而且在「串珠子」(也就是合成 DNA 鏈條)的過程中,錯誤率不可避免。目前大約每合成 100 個堿基就會出現(xiàn)一個錯誤。這是由目前的化學合成技術帶來的瓶頸,每合成一個堿基,有 99.9% 以上的正確率。但是當堿基串變長,0.01% 的概率相乘,錯誤就難以避免。目前人工合成 DNA 的單鏈的長度一般不超過 100 個堿基,極限在 300 個堿基左右。而在自然界的 DNA 動輒有幾千個堿基對。

也就是說,雖然 DNA 的存儲能力很強,但它們不得不以很多條短鏈的方式存在。如果存儲的信息量比較大,這些 DNA 短鏈就像一本散裝的書。它可以存儲很多信息,存在形式卻是一張張標著頁碼的紙。當然,可以將一條條 DNA 短鏈拼接成長鏈。這就意味著增加了一道工序。在測序的過程中,又需要把長鏈打斷成短鏈。這是因為目前技術還不能一次性讀取長鏈。

在測序的過程中,也存在錯誤率。盡管目前的錯誤率已經低至 10^-3 數(shù)量級,比起商業(yè)硬盤的讀寫錯誤率,仍相差至少 9 個數(shù)量級。

正確率受到合成和測序這兩項技術的影響,科學家想到設計編碼方案來避免:在編碼中增加糾錯機制。這樣,哪怕堿基合成和測序中出現(xiàn)了錯誤,依舊能夠保證被存儲進 DNA 的內容能夠被正確讀取出來。

03

走出實驗室,

還要考慮速度和成本

DNA 存儲也正在嘗試走出實驗室。

2020 年 10 月,微軟、西部數(shù)據(jù)和基因測序巨頭 Illumina、DNA 合成初創(chuàng)公司 Twist Bioscience 等聯(lián)合成立了 DNA 數(shù)據(jù)存儲聯(lián)盟。

這是世界上第一個該領域的學術和產業(yè)鏈聯(lián)盟。這個聯(lián)盟希望制定技術和格式標準,最終建立一個可以通用的商業(yè)系統(tǒng)。

微軟研究院在 2015 年就成立來 DNA 存儲的項目,并聘請了華盛頓大學的計算機科學與工程學院的副教授 Karin Strauss 擔任高級首席研究經理(Senior Principal Research Manager)。

2013 年,她和同事去英國 EBI 訪問,了解到 Goldman 和同事們關于 DNA 存儲的研究,就對這個方向產生了很大的興趣。Strauss 說,「DNA 的密度、穩(wěn)定性和成熟度讓我們興奮。」

在他們的研究中,想開發(fā)的是另一個功能:隨機讀取。常見的 DNA 測序技術中,必須要將所有的堿基串一次性讀取完,才能夠獲得信息。要么不讀取,要么全讀。如果只想要數(shù)據(jù)中的某一個小片段,就會非常麻煩。

2016 年,他們發(fā)表了一項研究,可以在 DNA 已經存儲的信息中搜索到指定的圖像,定位后,用酶來復制所需的 DNA 的片段,然后只需讀取這一小段即可。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

Karin Strauss(右)和兩位研究合作者|來源:csenews

要讓 DNA 存儲離商用更進一步,還需要解決合成速度和成本?,F(xiàn)在合成速度是每秒存儲上千個字節(jié)(KB),成熟的云存儲方案已經有每秒千兆字節(jié)(GB)以上。

這意味著,編寫 DNA 的速度還需要提升 6 個數(shù)量級。如何讓提升數(shù)據(jù)處理量?就像并行計算能夠提升數(shù)據(jù)處理速度,科學家希望 DNA 在合成時也可以并行多條,同時處理。

2021 年,微軟開發(fā)出首個納米級 DNA 存儲器,能夠在每個平方厘米的區(qū)域上,同時合成 25X106(2650)條堿基序列。這個新的技術把原來同時合成堿基序列的數(shù)字從個位提升到了千位。這個吞吐量,讓 DNA 合成速度變成了每秒兆字節(jié)(MB)。

你身體里的 DNA,能存下整個宇宙的數(shù)據(jù)

新的方法讓 DNA 合成的陣列數(shù)量大大增加|來源:微軟研究院

更大的吞吐量,也就意味著更低的成本。現(xiàn)在 DNA 存儲的成本是每萬億字節(jié)(TB)8 億美元。而磁帶存儲成本已經降到了每萬億字節(jié) 16 美元以下。這樣比起來似乎毫無競爭力。但現(xiàn)實生活中的大型數(shù)據(jù)中心的維護成本極高,還要定期更新硬件;DNA 存儲密度大、體積小、可以長時間不變質的優(yōu)勢就變成了降維打擊。

所以量大、讀取頻率低的「冷數(shù)據(jù)」,被認為是 DNA 存儲最近的應用場景。Twist Bioscience 最近在一份市場報告中強調,這種技術能夠幫助科技企業(yè)「大規(guī)模、低功耗」情況下更有效地部署。

另外一些樂觀的科學家,更相信技術的進步。

自 2003 年人類基因組計劃完成以來,測序成本降低了 200 萬倍。2016 年時,面對每秒千字節(jié)的速度,Goldman 說,「(讀寫的速度提升)6 個數(shù)量級對基因組學來說沒什么大不了的。你只需要再等一會兒?!?/p>

那這「一會兒」是多久呢?這個領域似乎到了臨門一腳,仍在等待突破。

* 頭圖來源:視覺中國

原文地址:http://www.myzaker.com/article/62eb5d488e9f0950f070245b

版權聲明:虛像 發(fā)表于 2022年8月4日 pm2:27。
轉載請注明:你身體里的 DNA,能存下整個宇宙的數(shù)據(jù) | 快導航網(wǎng)

相關文章

全网免费在线播放视频入口| 少妇黄色一级片| 欧美猛烈性xbxbxbxb| 亚洲男人天堂2019| 四虎影院成人| 亚洲国产精品久久不卡毛片| 久久青青草视频| 国产成人鲁色资源国产91色综| 性生活在线视频| 精品72久久久久中文字幕| 国产精品v欧美精品v日韩| 国产有码在线| 久久99久久久久久久噜噜| jiuse九色最新地址| 538在线一区二区精品国产| 精品毛片在线观看| 国产精品福利一区二区| 影音先锋男人在线| 国产农村妇女精品一二区| 美女在线视频一区二区| 天天弄天天操| 三级成人在线视频| 久久久久久久久久久久久久久国产 | 欧美xxx.com| 色噜噜狠狠狠综合曰曰曰| 午夜成年女人毛片免费观看| 欧美在线观看视频一区二区| 午夜精品久久久久久久第一页按摩 | 欧美黑人巨大xxxx猛交| 午夜精品偷拍| 国内精品免费**视频| 亚洲一区二区三区小说| 欧美激情xxxx| 91精品久久久久久久久久入口| 无码人妻精品一区二区三区66| 亚洲精品无码久久久久| 精品女厕厕露p撒尿| 国产香蕉精品| 久久婷婷色综合| 日韩欧美一级二级三级| 97人人干人人| 5g影院5g电影天天爽快| 亚洲国产一区二区三区四区| xxxx性欧美黑人| 在线成人av网站| 最近中文字幕大全中文字幕免费| 精品久久久久久亚洲国产300| av片免费播放| 亚洲国产cao| 精品黑人一区二区三区国语馆| 亚洲色图欧洲色图婷婷| 国产精品51麻豆cm传媒| 国产精品久久久久久久第一福利| 狠狠人妻久久久久久| 国产成人亚洲综合色影视| 美国美女黄色片| 国产一区福利在线| 亚洲欧美综合7777色婷婷| 国内久久婷婷综合| 黄色精品视频在线观看| 国产一区二区免费视频| 黄色香蕉视频在线观看| 国产精品18久久久| 熟女少妇a性色生活片毛片| 国产精选一区二区三区| 久久久久亚洲av片无码| 国产精品99久久久久久似苏梦涵 | 国产交换配乱淫视频免费| 日韩成人午夜精品| 成人国产精品久久久网站| 拍真实国产伦偷精品| 亚洲老板91色精品久久| 18岁以下禁止观看的美女视频 | 尤蜜粉嫩av国产一区二区三区| 最新在线你懂的| 91成人福利| 亚洲精品国产精品国产| 91精品一区二区三区综合在线爱| 日本二三区不卡| 欧美三级电影在线播放| 久久国产精品波多野结衣av| 在线国产网址| 一区二区三区韩国免费中文网站| 亚洲国产成人tv| 国产区一区二区| 玖玖爱在线观看| 欧美电影h版| 久久精品日产第一区二区三区精品版 | 亚洲欧美国内爽妇网| 天天综合天天| 久久精品国产久精国产思思| 色网址在线观看| 欧美做受高潮1| 在线xxxx| 精品网站在线看| 亚洲精品69| 日本福利视频网站| 国产影视一区| 激情五月婷婷基地| 国产精品二区不卡| 性鲍视频在线观看| 青娱乐精品视频| 成人涩涩小片视频日本| 91首页免费视频| 亚洲成人第一网站| 亚洲国产精品一区二区久久| 亚洲激情丁香| 精品蜜桃在线看| 天天色天天色| 久久久久久91香蕉国产| 久操视频在线观看| 国产精品日韩欧美一区二区三区| 久久精品国产福利| av高清在线免费观看| 91成人网在线观看| 制服丝袜第一页在线观看| 国产一区二区三区在线观看免费| 国产午夜福利片| 亚洲精品中文字幕在线观看| 亚洲日本色图| 亚洲第一视频网| av在线不卡播放| 国产精品一二三视频| 欧美日韩视频网站| 无码人妻精品一区二区三区99v| 国产综合久久久| 在线精品视频播放| 国产成人精品亚洲午夜麻豆| japanese国产在线观看| 色一情一伦一子一伦一区| 91caopron| 欧美成人免费小视频| 国产在线看片| 欧美日本亚洲| 亚洲丁香日韩| 国产乱国产乱老熟300部视频| 国产欧美丝祙| 久久一二三四区| 一区二区三区高清| 麻豆精品视频在线原创| 上原亚衣av一区二区三区| 国产一二三区在线视频| 国产精品乱码视频| 国产精品中文字幕制服诱惑| 日日干日日操日日射| 精品一区二区三区在线播放视频| 国产99久久久| 欧日韩精品视频| 成人图片小说| 国产97在线亚洲| 成人国产网站| 国产日韩成人内射视频| 视频一区二区三区中文字幕| 免费成人深夜蜜桃视频| 亚洲欧美色综合| 精品一区二区观看| 欧美大尺度在线观看| 18aaaa精品欧美大片h| 久久精品在线免费视频| 亚洲激情偷拍| 国产性一乱一性一伧一色| 亚洲h动漫在线| 九九视频在线播放| 青草成人免费视频| 成人福利一区二区| 在线观看av网页| 国产精品99久久久久久久女警| 一级黄色大片免费| 欧美日韩国产片| 色佬视频在线观看| 国产一区在线免费| 精品久久中文| 色www亚洲国产阿娇yao| 一区二区三区中文免费| 91popny丨九色丨国产| 51ⅴ精品国产91久久久久久| 日本亚洲欧洲无免费码在线| 污污的视频免费| 青草影视电视剧免费播放在线观看| 中文字幕视频一区| 精品成人无码久久久久久| 欧美视频你懂的| 国产成人午夜精品| 51国偷自产一区二区三区的来源| 美女午夜精品| 91精品人妻一区二区| 亚洲欧洲国产日本综合| jizzjizz韩国| 青青草99啪国产免费| 免费观看亚洲视频大全| 最新版天堂资源在线| 国产精品入口麻豆九色| www.91popny.com| 日韩免费av在线| av成人男女| 中文字幕成人动漫| 天天色综合天天| 日本aa大片在线播放免费看| 狠狠色狠狠色综合人人| 国产精品97|