自然科學家往往試圖發現有機體的結構與功能之間的關系。而分子生物學又將這種傳統發揮到極致。分子生物學家研究有機體的組織結構, 直至了解細胞內發生的分子之間的相互作用。而研究也是從顯而易見的物理性質入手。作為自然科學中的結構- 功能主義的傳統模式就是研究解剖與生理, 而結構功能主義發展到具有重要生物學意義的分子條件基本成熟是在20 世紀的30 年代。物理化學家鮑林確定了研究分子內原子排列的物理規律。伯納爾發現X 射線晶體學可以研究諸如蛋白質等大分子結構。但是, 對于生物學中所存在的疑問, 持有還原主義思想的人們總是運用一些缺乏分子細節, 僅僅反映出暫時性的或存在人類自我中心限制的解釋來回答[1]。直到20 世紀50 年代DNA 概念提出前, 這種情況還在持續著。從那之后, 遺傳學和生物進化學便將DNA 當作包含生物機體及有關其進化方面的信息載體, 其中的一些觀點盡管備受爭論, 但是從生物的蛋白質結構到其復雜的表型特征間一切事物已經被這些觀點所支配, 無論對這些事物的精確解釋是通過一個正確還是從錯誤方式而來..2..。而對于結構到功能之間的鴻溝必然需要一種極具操作性的符號語言系統作為橋梁, 這也是分子生物學研究符號體系的重要存在價值之一。
1 分子生物學符號系統所體現的可操作性
布里奇曼曾在他的理論體系內對“操作”( operat ion) 進行了劃分, 其中, 他將科學家在研究活動中的思維活動歸結為“精神操作” ( 也稱“智力操作”) , 并又將其分為兩大類, 一類是“紙與筆的操作”, 即類似于物理學家在進行數學處理時所進行的操作, 包含了所有被應用于物理學的數學符號處理; 一類是“語言操作”, 包括語言和思維( 潛在的語言)[3]?刹僮餍赃@一性質在關于基因組學的研究當中得到充分體現。從某種意義上來說, 生物學的各個分支都與基因組的研究有關, 因為生物體的每個特征本身就是由它的基因組決定的( 諸如解剖學和動物學這樣的學科不在此范疇) 。在某一觀點上, 生物哲學家們是共通的, 那就是作為遺傳信息的滿意依據, 須抓住它的語義本質, 而這點正是基于數學理論的信息符號無法做到的[4]。即每一個分子生物學符號都有無法被取代的生物學指稱含義, 而這正是他們不同于數學、物理符號的地方。生物學符號基因組學包含了龐大的數據集, 比如人類基因組內就約含30 億個堿基對, 對其的研究采用的也是高通量( highthroughput ) 的方法, 即一種快速獲取數據的方法。在其領域內包括DNA 測序、在物種內進行基因組多樣性的采集以及基因轉錄調控的研究。在分子生物學產生的許多年來, 其一直作為.. 還原解釋.. 的工具, 被用來剖析細胞、理解細胞中各個部分的獨立工作方式。分子生物學中能被真正作為這種工具的部分應該是它的符號語言系統。它將傳統的生物學功能學說與現代微觀分子領域研究緊密聯結, 并不斷發現新的關聯性。
顯著的例子就是人類基因組項目的研究, 分子生物學的符號語言系統正式作為這些研究的核心工具, 一種建立在遺傳物質表達符號與遺傳物質構造模型基礎上的信息系統。對基因組學研究的核心主要體現在大量存在于染色體上的基因片段的測序工作。當把原始的序列數據組裝成連續區域后, 隨之而來的任務是分析編碼在序列中的信息。通過已知基因的比較或者搜索已知的基因特征來鑒定原始數據中的基因。而在比較方法中, 某些算法如Blast ( Basic Local Alig nment Search Tool) 是通過引入少的錯配和間隔將待查的序列與數據中的所有序列比對。得到由統計意義上的“hit”( 打擊) 意味著共同的結構和生化特征。一個DNA 序列被轉錄( 編碼序列) 的直接證據來自與一個已知的EST 和mRNA 序列的匹配。判斷一段序列代表一個基因的間接證據是它與人類或者其他生物的基因或者蛋白質同源。同時測序其他模式物種——特別是大腸桿菌、啤酒酵母、秀麗線蟲、裂殖酵母、果蠅、小鼠和擬南芥, 以產生越來越多數據提供給強大的已知基因數據庫[5]。
從這些基因研究的方法中我們不難看出, 現代分子生物學研究中所體現的研究方法越來越近似于一種信息的采樣、處理工程。各種生物的特性統統表現為大量的核苷酸序列排布方式, 這種排布方式的表現形式正是分子生物學符號語言表達形式之一。它將不同種的生物、不同類的組織、器官通過一串序列符號表達出來, 將研究對象由研究實體轉變為語言信息。而進一步的, 作為轉基因技術的基因改造工程也是以這些符號信息為先導, 通過信息間的重組達到給予實驗課題的合理實驗設計。這種符號信息上的操作成為駕馭微觀實在的有效工具, 成為所研究對象的可操作系統。研究者所面對的是這一操作系統中的符號信息, 通過對這些符號信息的對比操作完成實驗的設計和推理。而這一操作系統中的符號信息是直接建立在所研究的、被認為存在著的微觀實在基礎之上。這一點類似于計算機的工作原理: 進行實際工作的是計算機的硬件系統, 它所處理的不過是大量的0、1符號所組成的二進制運算, 輸入CPU 的指令以及所產生的運算結果都為二進制數字。而軟件系統的功用就是為這些二進制數字賦值, 用以代表不同所要執行的操作, 作為這種操作的結果才是計算機使用者可掌握的信息。分子生物學研究中所使用的研究語言系統正是它的操作系統, 為研究者探索微觀客體提供了一便捷、有效的途徑。
所以, 在對分子生物學符號操作性功能的理解上不難做出如下總結:
其一, 作為學科研究的用語, 分子生物學語言的作用體現在為研究者提供了一種可直接進行模擬研究的平臺, 一切理論成果的推導和解釋都圍繞它來完成, 從而能夠滿足D- N 模型(演繹- 法則解釋)。
其二, 分子生物學研究( 如基因研究) 常采用的方法往往是通過以已知客體為模板來對比所研究客體, 從而認識所研究客體。但兩個客體在通常情況下是不能通過研究者感覺經驗來對比的, 只有在分子生物學符號系統內才表現出可通約性。
其三, 分子生物學的某些研究工作需要其他學科領域工作人員來協力完成, 對于這些具體工作的進行方式, 工作人員是通過分子生物學符號語言為操作媒介來進行本領域內的處理( 如電腦操作人員利用計算機來處理基因數據) 。
總之, 分子生物學研究中的大量工作都是在分子生物學符號體系框架內完成的, 而這些功用所體現出的正是分子生物學符號的優越性所在, 即符號以及符號之間所展現出的生物學意義與符號在數據處理方面的功用是分離的。離開這一框架, 研究者將很難對所研究的客體作出清晰明確的認識。
2 分子生物學符號系統對于其傳播的意義
學科的發展與學科在不同科學共同體間以及整個社會中的健康傳播密不可分。而對于一門新興的學科, 或者暫時只能稱之為一種理論、一種思想, 對于它們的產生在之初以至相當長的一段時間內一直存在著認識認同的問題, 這往往決定了它在今后的思想取向、概念圖式、范式、問題群以及探索工具等諸多方面。關于認識的認同就是指同樣對這一研究領域感興趣或只是由于自身工作需要而不得不對這一領域保持關注的科學家們, 他們在各自的工作中所取得的進展需要在這個松散共同體內得到初步的認同, 從而逐步在這一研究方向上確立自己的領域并規范今后研究的模式。只有達到一定范圍內的認識認同, 并通過學科的傳播得到社會認同, 從而形成了學科的制度。這一制度決定了這個領域招募新成員的模式, 培訓和教育的程序, 以及各人研究和合作研究的的程序。更重要的是, 這其中也包括了基本的交流模式, 其中既有非正式的交流模式, 也有那些在雜志中所確立的學科的交流模式, 在或大或小的程度上提供給這個學科的交流模式。因而對于從事彼此相關研究、相互交流信息, 并且鮮有爭論的研究者而言, 這些促使了研究者們的“無形學院”[6]的出現。它可理解為一群群地域上分散的科學家, 他們彼此之間認識上互動, 比與更大的科學家共同體的其他成員之間的認識互動更為經常。所以, 對于研究者所獲得的研究信息以及做出的理論假設須在這個“無形學院”內進行流通才可獲得應有的認可, 進而成為獨立的研究領域獲得后續發展的可能。在至關重要的知識流通中, 流通信息的形式無疑是決定性的。
( 1) 合理的研究策略對分子生物學發展的助推作用
從生物學發展的歷史回顧便會發現, 在分子生物學興起之前所有的實驗方法對充分了解基因來說都不一定適用, 而也正是這種基因情結推動著分子生物學產生之前的微觀生物學研究的發展。從1900 年到1950 年間, 遺傳學家們究竟持有哪些基因概念很難確定, 在這里主要提到四種認識: 可能古老的觀點是將基因本身看作是生物的結構物質。達爾文的微芽學說可能接近這一觀點; 廣泛流行的是二種觀點, 即認為基因是酶( 或像酶一樣起作用) , 作為體內化學過程的催化劑。這一觀點在主要原則方面可以追溯到哈伯蘭德( 1887) 和魏斯曼(1892) ; 當核酸的重要性開始被人們認識時, 基因被看成是能量傳遞的一種手段; 一種觀點是把基因看作是特殊信息的傳遞者, 在1953 年以前若說到基因一些學者必定會談到它[7]。所以從1910 年到1950 年這一段時間里科學家越發認識到遺傳的物質基礎是由高度復雜的分子所構成, 要取得進一步進展惟一的辦法是更多地了解基因的化學。將遺傳的分子基礎無論看成是無定形的顆粒還是當作簡單分子顯然都不合適;虻难芯恳巡辉偈莻鹘y的生物學家的問題, 它已經成為生物學、化學和物理學之間的邊緣地帶, 而且起初是無人區。不同于物理、化學等學科, 在進化生物學中, 理論極大地建立在諸如競爭、雌性選擇權、選擇、演替和支配等觀念之上。作為理論基礎的這些生物學觀念不能歸并為物理學般的定律與原理[8]。任何想要開發這一領域的科學家都須通過一整套以形式系統方式出現的理論描述來闡釋自己晦澀的研究思想, 并說服同領域以及其他相關領域的研究者接受并采納這一系統, 確立符號系統在日后研究中的核心地位, 而以此便確立了學科的誕生。當然, 所有這些工作不可能都由一個人完成, 沒有無數研究者的研究積累就不可能有走向成功“后一擊”。
那么什么才叫成功的“后一擊”呢? 以庫恩對科學發生和發展一般經歷的觀點所進行的劃界看來, 分子生物學的前科學時期[9]并不像他本人所描述的那樣是由某一門學科遭遇到的理論危機所引發的學科交替, 而是由許多業已存在的各門學科對生命微觀活動本質的各種觀點的相互爭論環境下, 由其中一派的觀點戰勝了其他觀點從而達到了學科的常規科學時期。因為它本身就是在各大學科的夾縫間一直存在著的, 一直到包圍著它的其他學科已經發展到了一個很高的水平的時候, 相關研究者的目光才逐漸轉向了這里。但此時的學科領域還是一片混沌, 全然沒有任何條理性的知識可言, 即使有也只不過是透過物理、化學等學科在這一領域的交集部分所得出的各種無法關聯、雜亂的信息。所以, 在這種情況下, 相應的針對分子生物學領域的研究策略的建立以及通過這種策略建立的具有良好兼容性的理論框架具有十分重要的意義的。梅達沃( 1967) 曾十分明睿地強調指出一個可行的研究計劃對科學家來說是多么重要。例如, 從內格里、魏斯曼到貝特森的所有遺傳學家之所以沒有能夠提出一個完善的遺傳學說是因為他們想同時解釋遺傳( 遺傳物質的逐代傳遞) 和發育現象。而摩爾根的明智就在于他將發育生理問題擱在一邊而集中全力于遺傳物質的傳遞問題。他從1910 年到1915 年的開拓性發現完全是由于這一聰明的抉擇, 因為其中某些問題, 例如為什么在順位的基因和在反位的基因效應不同( 位置效應) 直到50 多年之后才弄清楚[10]。
由此可見, 研究者在試圖探索某一領域時, 其一要做的便是劃定自己的研究目的范圍, 這是個綜合的評判過程, 需要有相當的知識積累, 當然也離不開運氣的成分。一旦它正式確定, 所有的理論設想也都以它為基石進行構建。當研究領域內的符號系統以及理論模型正式建立起來的時候, 它們無疑都是為了能更好的解釋研究者所確立的目的領域而存在的, 決定了理論能否易于被主流學術團體所接受。同時, 這里面也包含了有關理論解釋的思考方式。比如, 正當達爾文從事進化論研究時, 歸納法( 或據認為是歸納法) 聲勢正隆, 達爾文因而鄭重聲稱他追隨的是“真正的培根方法”, 而實際上他的假說——演繹方法絕對不是歸納法[11]。這么做的目的也并不是為了借助這種研究方法取得多大的研究進展, 而不過是為了進入一種學術風尚, 使自己的理論看起來顯得更加入時, 更加“科學”。
( 2) 合乎時代認知背景的科學修辭手段的運用
20 世紀50 年代分子生物學的突破和信息科學的誕生在時間上正好巧合, 信息科學中的一些關鍵詞, 如程序、編碼也在分子遺傳學中使用。編碼的“遺傳程序”一代又一代地經過修飾并且編入歷史信息, 成為了一個強有力而又為人們熟悉的概念。這也是一次成功的科學傳播操作, 通過引用在當時十分熱門的科學詞匯來描述基因的大致工作原理, 大膽提出了基因編碼這一概念, 吸引了當時許多研究者的注意, 并不斷取得了更多的關注。需要說明的是, 在這一領域, 持有基因理論多元論的人( 比如S& K) 認為存在非彼即此的、具有同等適用性的論述來作為基因的解釋理論[12]。但從本文觀點來說, 在公眾對理論的選擇方面, 似乎不可能存在著并列的理論。例如赫林( 1870) 和西蒙( 1904) 的“記憶單位”( mneme) 概念, 起初是用來支持獲得性狀遺傳的, 而且肯定屬于編碼的“遺傳程序”這一范疇。更接近的是His( 1901) 將種質的活動比作訊息( message) 的產生, 種質活動的結果當然遠比簡單訊息復雜。遺傳程序作為不動的運轉者( unmoved mover,德爾布魯克, 1971) 的概念是如此新穎以至于在1940 年代以前還沒有人理解它[13]。這也說明, 如果過分超前的使用一些在當時看來還十分陌生的學術名詞以及描述方式, 就會出現對理論認知的延遲。一旦理論的解釋能力出現了問題, 就無法在已初步形成的研究共同體內得到認同。這無疑阻礙了學科理論的傳播?偨Y其原因, 那就是當一套新的理論提出時, 它的解釋系統中所采用的符號表達、名詞指稱以及表達形式等諸多方面均不能脫離當時的社會認知背景, 須采用合理的科學修辭手段, 才能使理論、乃至整個學科得到廣泛的認同。
( 3) 對學科內己證明概念和學說的表達方式不斷進行的改進, 使其適應時代環境的需要
分子生物學研究的歷史就是對DNA 這種遺傳物質進行科學揭示的歷史。了解雙螺旋及其功能不僅對遺傳學而且對胚胎學、生理學、進化論, 甚至哲學都有深刻影響。雖然早在19 世紀80 年代和90 年代就一再有人懷疑遺傳物質可能和軀體的結構物質有所不同, 而且即使1908 年創用了“遺傳型”和“表現型”這兩個詞, 直到1944 年才充分認識它們在根本上不同的。從1953 年以后人們才知道遺傳型的DNA 本身并不進入發育途徑而只不過是一套指令。對雙螺旋的了解開拓了一個廣闊的、激動人心的研究新領域, 而且可以毫不夸張地說由于這一發現的結果分子生物學在隨后的15 年中完全左右了生物學。對遺傳現象真正本質的長期研究已告結束。沒有解決的問題越來越多的是生理學問題, 涉及基因的功能以及它在個體發生和神經生理學方面的作用。在這種背景下, 對所有已有的研究信息的歸集整理便成為一項棘手的問題。便是對于分子生物學的研究成果采用何種表達策略, 對于其中的理論如何確立表述形式, 這是相當重要的一項工作。一套程序和方法往往被認為是一個過程或者說是為了產生某一特定的結果( 而不是所產生的結果本身) 。分子模板的概述可被理解為具有解釋功能的產物的綜合。即就P 為生成Q 所提供的說明內容而言, 模板P 就是關于Q 的產生[14]。所以對于理論Q 來說, 模板P 在認識Q 的過程中就顯得至關重要。模板在這里可當作為解釋理論所采取的敘述手段。在生物學史上就曾有一些例子表明某個定律、原理或概括, 起初用一般的文字陳述時曾被人們忽視, 后來用數學表達時就受到歡迎并被普遍接受。例如凱塞爾于1903 年曾指明種群中的遺傳型組成當選擇停止時保持穩定不變, 但這一結論并沒有得到重視, 直到哈蒂和溫伯格于1908 年用數學公式表述時才得到公認。從以上不難看出采用何種表述方式對分子生物學來說是至關重要的, 它直接決定了學科在科學界的影響力。實際上, 分子生物學的表達方式借鑒了許多其他流行學科的表述方式。這些無疑對學科的發展是大大有利的。這里要補充說明的是, 物理科學在400 多年中為科學制定了一切規范或模式。即使是充滿了現代氣息的分子生物學, 在學科初的嘗試之時, 也是從一種物理觀念來介入的。但是那種物理主義的思想對于學科來講有時卻是不利的, 正像物理主義所宣稱的那樣, 物理事實構成全部事實[15]。在物理科學中當某一定律對一組特殊現象適用時, 一般它也同樣適用于相似的現象, 除非這一定律所不適用的現象表明這些現象是和它所適用的現象不同。這種看法在物理科學中被證明具有相當大的啟示意義。但是生物學中的許多現象都很獨特, 實際上所有的所謂定律都有例外, 認為定律具有普遍意義的觀點曾經導致許多爭議和無效的概括性結論。經常發生這樣的情況, 將對某一物種或高級分類單位的觀察研究結果通過概括擴展到一切其他分類單位, 后來卻發現這樣的概括結論并不適用。在概念和學說成熟過程中的許多重要進展是由于從其他領域輸入了觀念或技術的結果。這些投入( 輸入) 可能來自生物學的其他分支, 例如遺傳學來自動物、植物育種、細胞學、系統學, 也可能來自物理科學( 尤其是化學) 或數學。某一門科學中的成熟理論和模型當移植到另一科學領域中時往往也適用, 有時還會產生有價值的效果。又比如, 分子生物學在表述基因原理的時候, 就利用了當時十分熱門的計算機程序編碼的形式, 將DNA 上的各種化學基以及功能單元分別以不同編排的字符串來表達, 使有關生物遺傳特性的描述能夠以一種符號語言的形式來體現。同時將分子生物學中的一些成果轉化成了定理的形式, 而定理是建立在符號系統上的。如“查爾加夫規則”, 它所表述的是在一段雙鏈DNA 中A+ G= T+ C 且A= T、G= C, 它就像數學定理一樣在有關基因序列的各項分析、研究中處處被遵守著。
3 結語
從分子生物學的符號表達方式上, 我們可以看出許多其他學科所采用的表達方式的影子。這使得我們在接受它的理論含義時并不需要費太大的力氣, 能夠以一種很直觀的方式了解到在生物體發生時, 生物體內的遺傳物質究竟是怎樣運作的。并且, 還能像讀書一樣讀取基因片斷上所蘊含的遺傳信息含義。這一切都得歸功于分子生物學的符號表達系統。這也就能解釋, 為什么當人類基因組測序項目啟動時, 能引起全球各國公眾的廣泛關注; 又為什么關于人類克隆的爭論會波及那么大的范圍。這些事例無不體現了當今分子生物學及其應用技術的威力早已深入人心, 人們對于分子生物學的認識也是在現代各門前沿學科中比較普及的。如此大范圍的關注, 同時也確保了分子生物學成為當今重要的學科之一。