寫在前面的話
相信很多人看到這里就像教訓下小編了,口氣好大,很有一副院士的口氣。
大家不要生氣,聽小編慢慢道來。
之所以標題命名為《重新定義生信分析》有三個原因:
1、標題黨,這樣的標題容易讓大家感興趣。
2、我所寫的是生信分析,不是生物信息,言下之意僅僅是對市場上或者科研工作者手中的所作的所謂產品進行簡單的評價。
3、之所以重新定義,是小編越發的感覺市場對生信分析的不夠重視,此篇也意在表明自己的所謂態度。
魯迅說:急不擇言的時候并不是沒有時間想,而是在于有時間的時候沒有想。
請大家原諒小編一時興起的口不遮攔。
正文
談到生信工具,包括語言和各種軟件甚至于算法,大家都不會太陌生。至于其產生的產品,大家更應該是天天熟視。但是不知道大家有沒有遇到過這樣的事情。同樣的一個問題,比如說差異表達基因的篩選,不同的人,不同的軟件,不同的方法,篩選的結果不一致。
經常會聽到A公司的結果和B公司的結果不一致。
大家有想過這個問題產生的原因嗎?或者遇到這種情況,我們應該怎么去處理,相信誰?
換一個場景。
小編想起微商經常用的圖片,但是確實比較切題,就是同樣是姑姑能一樣嗎?
雖然吐槽了點,但是還是很能說明問題的。
通常情況下,我們買一個產品,會在乎其在內的品質,比如電腦會看中其CPU,顯卡,內存等。手機會看中屏幕,像素,信號等。但是我們作為普通消費者,我們沒有能力去分辨產品的好壞,尤其是內在品質的優良,因此我們只能選擇品牌。
好的品牌代表好的一切。
這對于企業無疑是最重要的。
大家都有共識華為的手機就是比華強北的要好。
大家愿意為好的產品支付更多。
對待產品如此,相信大家對待服務也是一樣的。相信路邊攤和海底撈的服務相差還是挺大的。
但是大家有聽過生信行業的產品有好和壞之分嗎,聽說過服務有好壞之分嗎?在整個行業標準沒有建立起來的今天,大家會統統的認為所有的生信分析都是一樣等級的產品,沒有任何區別。
一個工作N年的富有相關經驗的從業者,利用N多種方法,通過N中參數組合,并加上各種模型的演算最終篩選出來的基因叫做差異基因。
另外一個跑跑流程出來的差異基因也叫差異基因。
沒有區別??蛻粼敢庵Ц兜馁M用是一樣的,這樣就不會有人做第一種模式,只會從反反復復的周而復始的做第二種模式。
當然對于學生而言,如果從沒有接觸過生信,建議真的不要自己做了,這個行業說簡單很簡單,說難也很難。
就拿blast來說,誰能把原理講清楚,誰能知道這個軟件有多少參數,最后的結果除了E值還有啥等等。你不知道也能用,但是效果就打折扣。
生信就是一個簡單的工具,就像一個汽車一樣,新手也可以開,但是可以拉活的老司機的水平,是新手沒辦法媲美的。
這是生信人的悲哀,也是整個行業的悲哀,整個行業上沒有品牌的樹立,也沒有人樂于為生信人更多的智慧埋單。
在小編看來生信分析,更應該像數據挖掘,模式識別一樣的重要。(好多做生信的轉行去了大數據公司),共同點都是通過一堆工具各種組合,各種算法, 挖掘出非常好的東西,甚至于開發出更適合的軟件和算法,而不是一套乏善可陳所謂標準分析。
生信分析更像燒治一道菜,同樣的材料和佐料,燒制出來的美味佳肴和難以下咽的黑暗料理,更多的區別是在于制作者。
吐槽
但愿有一天,從業者再跟客戶溝通時,客戶更多的不是關注價格,還是其價值。
數據是死的,便宜有便宜的做法,貴有貴的道理。
相信慢慢的還是會有人重拾對生信的熱愛和重視。
生信不死,它只是暫時凋零。
歡迎關注生信人
