亞馬遜雲科技與加拿大不列顛哥倫比亞大學雲創新中心達成合作
亞馬遜雲科技宣佈近期與加拿大不列顛哥倫比亞大學雲創新中心 (UBC CIC)達成合作,基於亞馬遜雲科技構建的超級計算平臺,助力國際科學家團隊在短短11天內搜索了近600萬份公開可用的生物樣本,成功識別出超過13萬種新的RNA病毒,其中包括9種新型冠狀病毒。 這一工作如果使用一台傳統計算機則需要2000年才能完成。 該項目實現了RNA病毒研究的又一創舉,通過識別並溯源新型病毒,科學家們希望在病毒感染人、牲畜、農作物和瀕危物種時,能夠更早地識別出它們,幫助防範全球傳染病大爆發。
在亞馬遜雲科技助力下,UBC CIC團隊和全球計算病毒學家啟動了The Open Virome(開放病毒組)專案,創建了開放的病毒發現雲計算平臺Serratus。 目前,該研究成果已經發表在科學雜誌《自然》上,同時還創建了公開的病毒資料庫,向全球科學界分享研究成果,説明加速對RNA病毒的研究。
RNA病毒引起的疾病包括普通感冒、流感、SARS、新冠肺炎、丙型肝炎、埃博拉、狂犬病、脊髓灰質炎和麻疹等。 由於RNA病毒繁殖和進化速度快,其更容易感染新的宿主物種。 如果基因組學研究人員能夠提前預見和識別新冠肺炎病毒,將徹底改變當前全球疫情的狀況。 基於亞馬遜雲科技的雲服務所取得的研究成果,從根本上改變了生物資訊學的研究方式。 在此之前,科學家們經過幾十年的數據分析,只發現了1.5萬種病毒。 在使用亞馬遜雲科技的基礎架構和服務后,The Open Virome專案團隊在發現新病毒方面已經為科學界節省了數百萬美元和長達數年的時間。
病毒的識別和研究需要分析海量的基因測序數據,這其中就包括數十萬種未知病毒的DNA和RNA。 基因組學的數據量每天都在成倍地增長,造成病毒測序資料庫的總量非常龐大,依靠傳統計算方式根本無法對其進行全面分析或處理。 The Open Virome專案負責人、計算病毒學家Artem Babaian認為,”預防未來大流行病的關鍵是知識。 我們的數據量正在迅速超過處理能力,我們擁有所需的所有資訊,但卻不具備使用這些資訊的工具。 ”
The Open Virome專案的研究人員僅用8周時間,順利地在亞馬遜雲科技上構建了功能強大的超級計算平臺。 借助亞馬遜雲科技卓越的彈性計算能力,他們能夠快速處理數百萬GB的數據,並且獲得了顯著的成本效益。 該團隊在亞馬遜雲科技Amazon Simple Storage Service(Amazon S3)中鏡像了病毒基因測序資料庫SRA,之後使用亞馬遜雲科技彈性計算雲實例Amazon Elastic Compute Cloud (Amazon EC2)來分析數據集。 專案組的目標是為處理每個測序數據集支付不到1美分,在專案完成時全面超越了這個目標,實際每個測序數據集支付不到半美分。
在短短11天內,該團隊就處理了高達570萬個測序數據集,並且僅僅花費了2.4萬美元,發現了13萬個新的RNA病毒。 通過基於亞馬遜雲科技搭建的Serratus平臺,研究人員相信他們既能識別潛在的有害新病毒,又能提醒科學家注意導致新冠肺炎病毒SARS-CoV-2 virus的潛在突變,説明改善診斷測試和疫苗開發,為醫療政策決策者提供更有效的指導。
醫療和生命科學行業是亞馬遜雲科技的優勢領域之一,通過在基因組學研究中應用雲計算,賦能客戶將更多的時間和資源用於科研,説明加速獲得洞見,更快地進行突破性研究和產品上市。 亞馬遜雲科技強大的計算和機器學習服務確保科學家可以快速地執行工作負載優勢,近乎無限的計算能力且靈活的定價能夠帶來非常高的性價比,同時遍佈全球的基礎設施和統一的架構,以及託管的40多個開放的生命科學和基因組數據集,能夠確保實現全球範圍內開展安全的研究協作。
關於亞馬遜雲科技
超過15年以來,亞馬遜雲科技 (Amazon Web Services)一直以技術創新、服務豐富、應用廣泛而享譽業界。 亞馬遜雲科技一直不斷擴展其服務組合以支持幾乎雲上任意工作負載,目前提供超過200項全功能的服務,涵蓋計算、存儲、資料庫、網路、數據分析、機器學習與人工智慧、物聯網、移動、安全、混合雲、虛擬現實與增強現實、媒體,以及應用開發、部署與管理等方面;基礎設施遍及26個地理區域的84個可用區,並已公佈計劃在澳大利亞、加拿大、印度、以色列、 紐西蘭、西班牙、瑞士和阿聯酋新建8個區域、24個可用區。 全球數百萬客戶,包括發展迅速的初創公司、大型企業和領先的政府機構,都信賴亞馬遜雲科技,通過亞馬遜雲科技的服務支撐其基礎設施,提高敏捷性,降低成本。