當Benjamin Delory開始關于記錄一種量化植物形態新方法的論文時,他意識到其中的一批數據可能會帶來問題。該論文提出一個“持久性的條形碼”來描述植物根系的分支結構。其中的挑戰是如何解釋它。德國呂訥堡大學博士后Delory說,該條形碼的基礎算法是“連續和動態的”。而表示動態的最佳辦法“是讓它動起來”。
科學數據被認為是典型的靜態圖像。但這些靜態圖像卻與基礎數據相互分離,這會阻礙讀者更詳細地探索它們,例如放大一些感興趣的特征。對于那些需要將數百萬個數據點填入僅有幾厘米大的密集視覺效果的基因組學家來說,這會特別棘手。
對于計算機運算領域的研究人員來說也是如此??茖W家經常會把軟件放到開源程序庫如GitHub等網站,但讓該代碼正常運行卻是“說起來容易做起來難”。評審人以及感興趣的人經常需要另外的軟件和配置才能讓這些算法運行。
一些期刊和平臺正在通過支撐交互性數據和代碼在彌補這一鴻溝。其中之一是F1000Research(F1000Research是針對生命科學研究者的開放研究發表平臺),該平臺去年曾與加拿大蒙特利爾計算機企業Plotly和美國紐約的一個機構代碼海洋合作。正是因為這些功能以及F1000Research開放獲取的思想,才讓Delory及合作者把論文遞交到那里。該成果已在1月發表。
交互出版
讓讀者可以深入到一篇文章中的基本數據的交互式圖表是很多網站上頻繁出現的特征,比如《紐約時報》和fivethirtyeight.com等網站,但這類圖表在科學出版中卻不常見。
代碼海洋每月向學者免費開放10小時和50吉字節的存儲空間;付費類則從每月19美元起步。它把代碼、數據、結果和計算環境融合在一起,該計算環境可在一個含有復制作者計算配置的“計算膠囊”中執行任務。其他用戶則可從代碼海洋網站或是論文中的一個部件來下載、修改和運行該代碼。
F1000Research現已經發表了6篇含有Plotly“活圖表”的論文以及含有代碼海洋小部件的5篇論文。今年,該期刊計劃增加對交互式“蛋白質—蛋白質相互作用”地圖的支持,這些地圖是利用網絡制圖工具Cytoscape生成的。可以看雜志的軟件
研究人員不必為感受到的復雜性困擾。據布魯金斯南達科他州立大學計算生物學家Xijin Ge說,他在自己的一篇論文中就包含了交互式Plotly圖表,創建相關數據僅需要一個額外代碼行數。西澳大利亞大學海洋研究所和地球科學系珊瑚學者Tom DeCarlo已經為多個期刊創建了6個代碼海洋項目,其中包括《古海洋學期刊》《古氣候學期刊》和《生物地球科學雜志》。“我認為它對于科學交流和再現性非常重要。”他說。
開源方法
對于那些尋求開源計算替代方案的人來說,一個叫作Binder的工具可將任何包含Jupyter記事本(交錯文檔、代碼和數據的文檔)或R代碼的公共GitHub存儲庫轉換為一個包裹,從而可以讓用戶從其瀏覽器一端運行。用戶只需在mybinder.org網站上把記事本存儲庫的地址輸入到搜索欄中,該程序就能創建一個可共享的交互式工作區。圣路易斯奧比斯波加州州立理工大學Binder項目團隊的Carol Willing說:“它真的適用于再現性,并且易于使用。”
瑞士蘇黎世Binder項目團隊成員Tim Head說,類似工具還可以簡化同行評審。Head有點沮喪,因為此前他受邀審閱一篇期刊文章時不能使用該軟件。“如果他們當時給我發送了Binder的連接,那么我們現在已經完成了。”他說。
本文來自電腦雜談,轉載請注明本文網址:
http://www.subeirui520.com/a/shouji/article-75978-1.html
@廣州白菜研究院凡凡凡凡凡凡
這首最好聽
超好看啊