亚洲喷奶水中文字幕电影,日本aⅴ高清一区二区三区,欧美亚洲日本国产,欧美日韩亚洲中文字幕

<legend id="flx4p"><abbr id="flx4p"><thead id="flx4p"></thead></abbr></legend>

<mark id="flx4p"><thead id="flx4p"></thead></mark>

      我要投稿 投訴建議

      《數(shù)學(xué)之美》讀書筆記

      時(shí)間:2025-02-11 12:14:49 敏冰 讀書筆記 我要投稿
      • 相關(guān)推薦

      《數(shù)學(xué)之美》讀書筆記(通用11篇)

        當(dāng)認(rèn)真看完一本名著后,想必你有不少可以分享的東西,這時(shí)就有必須要寫一篇讀書筆記了!那么你真的懂得怎么寫讀書筆記嗎?下面是小編精心整理的《數(shù)學(xué)之美》讀書筆記,供大家參考借鑒,希望可以幫助到有需要的朋友。

      《數(shù)學(xué)之美》讀書筆記(通用11篇)

        《數(shù)學(xué)之美》讀書筆記 1

        《數(shù)學(xué)之美》是一本領(lǐng)域相關(guān)的數(shù)學(xué)概念書,生動(dòng)形象地講解了關(guān)于數(shù)據(jù)挖掘、文本檢索等方面的基礎(chǔ)知識(shí),可以作為數(shù)據(jù)挖掘、文本檢索的入門普及書。另外,就像作者吳軍老師提到的,關(guān)鍵是要從中學(xué)到道----解決問題的方法,而不僅僅是術(shù)。書中也啟發(fā)式的引導(dǎo)讀者形成自己解決問題的道。

        下面記錄一下自己讀這本書的一些感想:

        第一章《文字和語言vs數(shù)字和信息》:文字和語言中天然蘊(yùn)藏著一些數(shù)學(xué)思想,數(shù)學(xué)可能不僅僅的是一門非常理科的知識(shí),也是一種藝術(shù)。另外,遇到一個(gè)復(fù)雜的問題時(shí),可能生活中的一些常識(shí),一些簡(jiǎn)單的思想會(huì)給你帶來解決問題的靈感。

        第二章《自然語言處理----從規(guī)則到統(tǒng)計(jì)》:試圖模擬人腦處理語言的模式,基于語法規(guī)則,詞性等進(jìn)行語法分析、語義分析的自然語言處理有著很大的復(fù)雜度,而基于統(tǒng)計(jì)的語言模型很好的解決了自然語言處理的諸多難題。人們認(rèn)識(shí)這個(gè)過程,找到統(tǒng)計(jì)的方法經(jīng)歷了20多年,非常慶幸我們的前輩已經(jīng)幫我們找到了正確的方法,不用我們?cè)偃タ嗫嗝。另外,這也說明在發(fā)現(xiàn)真理的過程中是充滿坎坷的,感謝那些曾經(jīng)奉獻(xiàn)了青春的科學(xué)家。自己以后遇到問題也不能輕易放棄,真正的成長(zhǎng)是在解決問題的過程中。事情不可能一帆風(fēng)順的,這是自然界的普遍真理吧!

        第三章《統(tǒng)計(jì)語言模型》:自然語言的處理找到了一種合適的方法---基于統(tǒng)計(jì)的模型,概率論的知識(shí)開始發(fā)揮作用。二元模型、三元模型、多元模型,模型元數(shù)越多,計(jì)算量越大,簡(jiǎn)單實(shí)用就是最好的。對(duì)于某些不出現(xiàn)或出現(xiàn)次數(shù)很少的詞,會(huì)有零概率問題,這是就要找到一數(shù)學(xué)方法給它一個(gè)很小的概率。以前學(xué)概率論的時(shí)候覺的沒什么用,現(xiàn)在開始發(fā)現(xiàn)這些知識(shí)可能就是你以后解決問題的利器。最后引用作者本章的最后一句話:數(shù)學(xué)的魅力就在于將復(fù)雜的問題簡(jiǎn)單化。

        第四章《談?wù)勚形姆衷~》:中文分詞是將一句話分成一些詞,這是以后進(jìn)一步處理的基礎(chǔ)。從開始的查字典到后來基于統(tǒng)計(jì)語言模型的分詞,如今的中文分詞算是一個(gè)已經(jīng)解決的問題。然而,針對(duì)不同的系統(tǒng)、不同的要求,分詞的粒度和方法也不盡相同,還是針對(duì)具體的問題,提出針對(duì)該問題最好的方法。沒有什么是絕對(duì)的,掌握其中的道才是核心。

        第五章《隱馬爾科夫模型》:隱馬爾科夫模型和概率論里面的馬爾科夫鏈相似,就是該時(shí)刻的狀態(tài)僅與前面某幾個(gè)時(shí)刻的狀態(tài)有關(guān)。基于大量數(shù)據(jù)訓(xùn)練出相應(yīng)的隱馬爾科夫模型,就可以解決好多機(jī)器學(xué)習(xí)的問題,訓(xùn)練中會(huì)涉及到一些經(jīng)典的算法(維特比算法等)。關(guān)于這個(gè)模型,沒有實(shí)際實(shí)現(xiàn)過,所以感覺好陌生,只是知道了些概率論講過的原理而已。

        第六章《信息的度量和作用》:信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。

        第七章《賈里尼克和現(xiàn)代語言處理》:賈里尼克是為世界級(jí)的大師,不僅在于他的學(xué)術(shù)成就,更在于他的風(fēng)范。賈里尼克教授少年坎坷,也并非開始就投身到自然語言方面的研究,關(guān)鍵是他的思想和他的道。賈里克尼教授治學(xué)嚴(yán)謹(jǐn)、用心對(duì)待自己的學(xué)生,對(duì)于學(xué)生的教導(dǎo),教授告訴你最多的是“什么方法不好”,這很像聽到的一句話“我不贊同你,但我支持你”。賈里克尼教授一生專注學(xué)習(xí),最后在辦公桌前過世了。讀了這章我總結(jié)出的一句話是“思想決定一個(gè)人的高度”。

        在這章中對(duì)于少年時(shí)的教育,以下幾點(diǎn)值得借鑒:

        1、少年時(shí)期其實(shí)沒有必要花那么多時(shí)間讀書,他們的社會(huì)經(jīng)驗(yàn)、生活能力以及在那時(shí)樹立起的志向?qū)椭麄円簧?/p>

        2、中學(xué)時(shí)花大量時(shí)間學(xué)會(huì)的內(nèi)容,在大學(xué)用非常短的時(shí)間就可以讀完,因?yàn)樵诖髮W(xué)階段,人的理解力要強(qiáng)很多。

        3、學(xué)習(xí)(和教育)是一個(gè)人一輩子的過程。

        4、書本的內(nèi)容可以早學(xué),也可以晚學(xué),但是錯(cuò)過了成長(zhǎng)階段卻是無法補(bǔ)回來的。

        第八章《簡(jiǎn)單之美----布爾代數(shù)和搜索引擎的索引》:布爾是19世紀(jì)英國的一位中學(xué)教師,但他的公開身份是啤酒商,提出好的思想的'人不一定是大師。簡(jiǎn)單的建立索引可以根據(jù)一個(gè)詞是否在一個(gè)網(wǎng)頁中出現(xiàn)而設(shè)置為0和1,為了適應(yīng)索引訪問的速度、附加的信息、更新要快速,改進(jìn)了索引的建立,但原理上依然簡(jiǎn)單,等價(jià)于布爾運(yùn)算。牛頓的一句話“(人們)發(fā)覺真理在形式上從來是簡(jiǎn)單的,而不是復(fù)雜和含混的”。做好搜索,最基本的要求是每天分析10-20個(gè)不好的搜索結(jié)果,積累一段時(shí)間才有感覺。有時(shí)候,學(xué)習(xí)、處理問題,可以從不好的方面入手,效果可能更好。

        第九章《圖論和網(wǎng)絡(luò)爬蟲》:圖的遍歷分為“廣度優(yōu)先搜索(Breadth-FirstSearch,簡(jiǎn)稱BFS)”和“深度優(yōu)先搜索(Depth-FirstSearch,簡(jiǎn)稱DFS);ヂ(lián)網(wǎng)上有幾百億的網(wǎng)頁,需要大量的服務(wù)器用來下載網(wǎng)頁,需要協(xié)調(diào)這些服務(wù)器的任務(wù),這就是網(wǎng)絡(luò)設(shè)計(jì)和程序設(shè)計(jì)的藝術(shù)了。另外對(duì)于簡(jiǎn)單的網(wǎng)頁,沒必要下載。還需要存儲(chǔ)一張哈希表來記錄哪些網(wǎng)頁已經(jīng)存儲(chǔ)過(如果記錄每個(gè)網(wǎng)頁的url,數(shù)量太多,這里可以用后面提到的信息指紋,只需要一個(gè)很多位的數(shù)字即可),避免重復(fù)下載。另外,在圖論出現(xiàn)的很長(zhǎng)一段時(shí)間里,實(shí)際需求的圖只有幾千個(gè)節(jié)點(diǎn),那時(shí)圖的遍歷很簡(jiǎn)單,人們都沒有怎么專門研究這個(gè)問題,隨著互聯(lián)網(wǎng)的出現(xiàn),圖的遍歷一下子有了用武之地,很多數(shù)學(xué)方法就是這樣,看上去沒有什么用途,等到具體的應(yīng)用出來了一下子開始派上大用場(chǎng)了,這可能就是世界上很多人畢生研究數(shù)學(xué)的原因吧。一個(gè)系統(tǒng)看似整體簡(jiǎn)單,但里面的每個(gè)東西都可能是一個(gè)復(fù)雜的東西,需要很好的設(shè)計(jì)。

        第十章《PageRank----Google的民主表決式網(wǎng)頁排名技術(shù)》:搜索返回了成千上萬條結(jié)果,如何為搜索結(jié)果排名?這取決與兩組信息:關(guān)于網(wǎng)頁的質(zhì)量信息以及這個(gè)查詢和每個(gè)網(wǎng)頁的相關(guān)性信息。PageRank算法來衡量一個(gè)網(wǎng)頁的質(zhì)量,該算法的思想是如果一個(gè)網(wǎng)頁被很多其他網(wǎng)頁所鏈接,說明它收到普遍的承認(rèn)和信賴,那么它的排名就高。谷歌的創(chuàng)始人佩奇和布林提出了該算法并用迭代的方法解決了這個(gè)問題。PageRank在Google所有的算法中依然是至關(guān)重要的。該算法并不難,可是當(dāng)時(shí)只有佩奇和布林想到了,為什么呢?

        第十一章《如何確定網(wǎng)頁和查詢的相關(guān)性》:構(gòu)建一個(gè)搜索引擎的四個(gè)方面:如何自動(dòng)下載網(wǎng)頁、如何建立索引、如何衡量網(wǎng)頁的質(zhì)量以及確定一個(gè)網(wǎng)頁和某個(gè)查詢的相關(guān)性。搜索關(guān)鍵詞權(quán)重的科學(xué)度量TF—IDF,TF衡量一個(gè)詞在一個(gè)網(wǎng)頁中的權(quán)重,即詞頻。IDF衡量一個(gè)詞本身的權(quán)重,對(duì)主題的預(yù)測(cè)能力。一個(gè)查詢和該網(wǎng)頁的相關(guān)性公式由詞頻的簡(jiǎn)單求和變成了加權(quán)求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN。看似復(fù)雜的搜索引擎,里面的原理竟是這么簡(jiǎn)單!

        第十二章《地圖和本地搜索的最基本技術(shù)——有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃》:地址的解析依靠有限狀態(tài)機(jī),當(dāng)用戶輸入的地址不太標(biāo)準(zhǔn)或有錯(cuò)別字時(shí),希望進(jìn)行模糊匹配,提出了一種基于概率的有限狀態(tài)機(jī)。通用的有限狀態(tài)機(jī)的程序不是很好寫,要求很高,建議直接采用開源的代碼。圖論中的動(dòng)態(tài)規(guī)劃問題可以用來解決兩點(diǎn)間的最短路徑問題,可以將一個(gè)“尋找全程最短路線”的問題,分解成一個(gè)個(gè)尋找局部最短路線的小問題。有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃問題需要看相關(guān)的算法講解,才能深入理解,目前對(duì)其并未完全理解。

        第十三章《GoogleAK-47的設(shè)計(jì)者——阿米特·辛格博士》:辛格堅(jiān)持選擇簡(jiǎn)單方案的一個(gè)原因是容易解釋每一個(gè)步驟和方法背后的道理,這樣不僅便于出了問題時(shí)查錯(cuò),而且容易找到今后改進(jìn)的目標(biāo)。辛格要求對(duì)于搜索質(zhì)量的改進(jìn)方法都要能說清楚理由,說不清楚理由的改進(jìn)即使看上去有效也不會(huì)采用,因?yàn)檫@樣將來可能是個(gè)隱患。辛格非常鼓勵(lì)年輕人要不怕失敗,大膽嘗試。遵循簡(jiǎn)單的哲學(xué)。

        第十四章《余弦定理和新聞的分類》:將新聞根據(jù)詞的TF-IDF值組成新聞的特征向量,然后根據(jù)向量之間的余弦距離衡量?jī)蓚(gè)特征之間的相似度,將新聞自動(dòng)聚類。另外根據(jù)詞的不同位置,權(quán)重應(yīng)該不同,比如標(biāo)題的詞權(quán)重明顯應(yīng)該大點(diǎn)。大數(shù)據(jù)量的余弦計(jì)算也要考慮很多簡(jiǎn)化算法。

        第十五章《矩陣運(yùn)算和文本處理中的兩個(gè)分類問題》:將大量的文本表示成文本和詞匯的矩陣,然后對(duì)該矩陣進(jìn)行奇異值SVD分解,可以得到隱含在其中的一些信息。計(jì)算余弦相似度的一次迭代時(shí)間和奇異值分解的時(shí)間復(fù)雜度在一個(gè)數(shù)量級(jí),但計(jì)算余弦相似度需要多次迭代。另外,奇異值分解的一個(gè)問題是存儲(chǔ)量大,而余弦定理的聚類則不需要。奇異值分解得到的結(jié)果略顯粗糙,實(shí)際工作中一般先進(jìn)行奇異值分解得到粗分類結(jié)果,在利用余弦計(jì)算得到比較精確地結(jié)果。我覺得這章講的SVD有些地方不是很清楚,已向吳軍老師請(qǐng)教了,等待回信。

        第十六章《信息指紋及其應(yīng)用》:信息指紋可以作為信息的唯一標(biāo)識(shí)。有很多信息指紋的產(chǎn)生方法,互聯(lián)網(wǎng)加密要使用基于加密的偽隨機(jī)數(shù)產(chǎn)生器,常用的算法有MD5或者SHA-1等標(biāo)準(zhǔn)。信息指紋可以用來判定集合相同或基本相同。YouTobe就用信息指紋來反盜版。128位的指紋,1.8*10^19次才可能重復(fù)一次,所以重復(fù)的可能性幾乎為0。判定集合是否相同,從簡(jiǎn)單的逐個(gè)比對(duì)到利用信息指紋,復(fù)雜度降低了很多很多。啟發(fā)我們有時(shí)候要用變通的思想來解決問題。

        第十七章《由電視劇《暗算》所想到的——談?wù)劽艽a學(xué)的數(shù)學(xué)原理》:RSA加密算法,有兩個(gè)完全不同的鑰匙,一個(gè)用于加密,一個(gè)用于解密。該算法里面蘊(yùn)含著簡(jiǎn)單但不好理解的數(shù)學(xué)思想。信息論在密碼設(shè)計(jì)中的應(yīng)用:當(dāng)密碼之間分布均勻并且統(tǒng)計(jì)獨(dú)立時(shí),提供的信息最少。均勻分布使得敵人無從統(tǒng)計(jì),而統(tǒng)計(jì)獨(dú)立能保證敵人即使知道了加密算法,也不能破譯另一段密碼。

        第十八章《閃光的不一定是金子——談?wù)勊阉饕娣醋鞅讍栴}》:把搜索反作弊看成是通信模型,作弊當(dāng)做是加入的噪聲,解決噪聲的方法:從信息源出發(fā),增強(qiáng)排序算法的抗干擾能力;過濾掉噪聲,還原信息。只要噪聲不是完全隨機(jī)并且前后有相關(guān)性,就可以檢測(cè)到并消除。作弊者的方法不可能是隨機(jī)的,且不可能一天換一種方法,及作弊是時(shí)間相關(guān)的。因此在搜集一段時(shí)間的作弊信息后,就可以將作弊者抓出來,還原原有的排名。一般作弊都是針對(duì)市場(chǎng)份額較大的搜索引擎做的,因此,一個(gè)小的搜索引擎作弊少,并不一定是它的反作弊技術(shù)好,而是到它那里作弊的人少。

        第十九章《談?wù)剶?shù)學(xué)模型的重要性》:早期的行星運(yùn)行模型用大圓套小圓的方法,精確地計(jì)算出了所有行星運(yùn)行的軌跡。但其實(shí)模型就是簡(jiǎn)單的橢圓而已。一個(gè)正確的數(shù)學(xué)模型應(yīng)該在形式上是簡(jiǎn)單的;一個(gè)正確的模型可能開始還不如一個(gè)精雕細(xì)琢過的錯(cuò)誤模型來的準(zhǔn)確,但是,如果我們認(rèn)定大方向是對(duì)的,就應(yīng)該堅(jiān)持下去;大量準(zhǔn)備的數(shù)據(jù)對(duì)研發(fā)很重要;正確的模型可能受到噪聲干擾,而顯得不準(zhǔn)確,這是不應(yīng)該用一種湊合的修正方法來彌補(bǔ)它,要找到噪聲的根源,這也許能通往重大的發(fā)現(xiàn)。

        第二十章《不要把雞蛋放在一個(gè)籃子里——談?wù)勛畲箪啬P汀罚簩?duì)一個(gè)隨機(jī)事件預(yù)測(cè)時(shí),當(dāng)各種情況概率相等時(shí),信息熵達(dá)到最大,不確定性最大,預(yù)測(cè)的風(fēng)險(xiǎn)最小。最大熵模型的訓(xùn)練非常復(fù)雜,需要時(shí)查看資料做進(jìn)一步的理解。

        第二十一章《拼音輸入法的數(shù)學(xué)原理》:輸入法經(jīng)歷了以自然音節(jié)編碼,到偏旁筆畫拆字輸入,再回歸自然音節(jié)輸入的過程。任何事物的發(fā)展,螺旋式的回歸不是簡(jiǎn)單的重復(fù),而是一種升華。輸入法的速度取決于編碼的場(chǎng)地*尋找這個(gè)鍵的時(shí)間。傳統(tǒng)的雙拼,記住編碼太難,尋找每個(gè)鍵的時(shí)間太長(zhǎng),并且增加了編碼上的歧義。根據(jù)香農(nóng)第一定理可以計(jì)算理論上每個(gè)漢字的平均最短碼長(zhǎng)。全拼不僅編碼平均長(zhǎng)度較少,而且根據(jù)上下文的語言模型可以很好的解決歧義問題。利用統(tǒng)計(jì)語言模型可是實(shí)現(xiàn)拼音轉(zhuǎn)漢字的有效算法,而且可以轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃求最短路徑問題。如今各家輸入法的效率基本在一個(gè)量級(jí),進(jìn)一步提升的關(guān)鍵就在于建立更好的語言模型?梢愿鶕(jù)每個(gè)用戶建立個(gè)性化的語言模型。輸入的過程本身就是人和計(jì)算機(jī)的通信,好的輸入法會(huì)自覺或者不自覺的的遵循通信的數(shù)學(xué)模型。要做出最有效的輸入法,應(yīng)該自覺使用信息論做指導(dǎo)。

        第二十二章《自然語言處理的教父馬庫斯和他的優(yōu)秀弟子們》:將自然語言處理從基于規(guī)則到基于統(tǒng)計(jì),貢獻(xiàn)最大的兩個(gè)人,一個(gè)是前面介紹的賈里尼克教授,他是一個(gè)開創(chuàng)性任務(wù);另一個(gè)是將這個(gè)方法發(fā)揚(yáng)光大的米奇·馬庫斯。馬庫斯的貢獻(xiàn)在于建立了造福全世界研究者的賓夕法尼亞大學(xué)LDC語料庫以及他的眾多優(yōu)秀弟子。馬庫斯的影響力很大程度上是靠他的弟子傳播出去的。馬庫斯教授有很多值得欽佩的地方:給予他的博士研究生自己感興趣的課題的自由,高屋建瓴,給學(xué)生關(guān)鍵的指導(dǎo);寬松的管理方式,培養(yǎng)各有特點(diǎn)的年輕學(xué)者;是一個(gè)有著遠(yuǎn)見卓識(shí)的管理者。他的學(xué)生為人做事風(fēng)格迥異,但都年輕有為,例如追求完美的邁克爾·柯林斯和尋求簡(jiǎn)單美的艾克爾·布萊爾。大師之所以能成為大師,肯定有著一些優(yōu)秀的品質(zhì)和追求。

        第二十三章《布隆過濾器》:判斷一個(gè)元素是否在一個(gè)集合當(dāng)中時(shí),用到了布隆過濾器,存儲(chǔ)量小而且計(jì)算快速。其原理是:建立一個(gè)很長(zhǎng)的二進(jìn)制,將每個(gè)元素通過隨機(jī)數(shù)產(chǎn)生器產(chǎn)生一些信息指紋,再將這些信息指紋映射到一些自然數(shù)上,最后在建立的那個(gè)很長(zhǎng)的二進(jìn)制上把這些自然數(shù)的位置都置為1。布隆過濾器的不足之處是它可能把不在集合中的元素錯(cuò)判成集合中的元素,但在某些條件下這個(gè)概率是很小的,補(bǔ)救措施是可以建立一個(gè)小的白名單,存儲(chǔ)那些可能誤判的元素。布隆過濾器背后的數(shù)學(xué)原理在于完全隨機(jī)的數(shù)字其沖突的可能性很小,可以用很少的空間存儲(chǔ)大量的信息,并且由于只進(jìn)行簡(jiǎn)單的算術(shù)運(yùn)算,因此速度非?!毒幊讨榄^》中第一章的那個(gè)例子就是布隆過濾器的思想。開闊思維,尋找更好更簡(jiǎn)單的方法。

        第二十四章《馬爾科夫鏈的擴(kuò)展——貝葉斯網(wǎng)絡(luò)》:貝葉斯網(wǎng)絡(luò)是馬爾科夫鏈的擴(kuò)展,由簡(jiǎn)單的線性鏈?zhǔn)疥P(guān)系擴(kuò)展為網(wǎng)絡(luò)的關(guān)系,但貝葉斯網(wǎng)絡(luò)仍然假設(shè)每一個(gè)狀態(tài)只與它直接相連的狀態(tài)相關(guān)。確定貝葉斯網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和各個(gè)狀態(tài)之間相關(guān)的概率也需要訓(xùn)練。在詞分類中,可以建立文章、主題和關(guān)鍵詞的貝葉斯網(wǎng)絡(luò),用來得到詞的分類。貝葉斯網(wǎng)絡(luò)的訓(xùn)練包括確定拓?fù)浣Y(jié)構(gòu)和轉(zhuǎn)移概率,比較復(fù)雜,后者可以參考最大熵訓(xùn)練的方法。貝葉斯網(wǎng)絡(luò)導(dǎo)出的模型是非常復(fù)雜的。

        第二十五章《條件隨機(jī)場(chǎng)和句法分析》:句法分析是分析出一個(gè)句子的句子結(jié)構(gòu),對(duì)于不規(guī)則的句子,對(duì)其進(jìn)行深入的分析是很復(fù)雜的,而淺層的句法分析在很多時(shí)候已經(jīng)可以滿足要求了。條件隨機(jī)場(chǎng)就是進(jìn)行淺層句法分析的有效的數(shù)學(xué)模型。條件隨機(jī)場(chǎng)與貝葉斯網(wǎng)絡(luò)很像,不用之處在于,條件隨機(jī)場(chǎng)是無向圖,而貝葉斯網(wǎng)絡(luò)是有向圖。條件隨機(jī)場(chǎng)的訓(xùn)練很復(fù)雜,簡(jiǎn)化之后可以參考最大熵訓(xùn)練的方法。對(duì)于條件隨機(jī)場(chǎng)的詳細(xì)參數(shù)及原理還不理解。

        第二十六章《維特比和他的維特比算法》:維特比算法是一個(gè)動(dòng)態(tài)規(guī)劃算法,凡是使用隱馬爾科夫模型描述的問題都可以用它來解碼。維特比算法采用逐步漸進(jìn)的方法,計(jì)算到每步的最短距離,到下步的最短距離只用接著本步的計(jì)算即可,相比窮舉法,大大縮短了計(jì)算的時(shí)間,并且基本可以實(shí)現(xiàn)實(shí)時(shí)的輸出,這看似簡(jiǎn)單,但在當(dāng)時(shí)確是很了不起的。維特比并不滿足停留在算法本身,他將算法推廣出去,并應(yīng)用到了實(shí)際中,創(chuàng)立了高通公司,成為了世界上第二富有的數(shù)學(xué)家。高通公司在第二代移動(dòng)通信中并不占很強(qiáng)的市場(chǎng)地位,而其利用CDMA技術(shù)霸占了3G的市場(chǎng),可見遠(yuǎn)見的洞察力是多么的重要。

        第二十七章《再談文本分類問題——期望最大化算法》:該章講的其實(shí)就是K均值聚類問題,設(shè)置原始聚類中心,然后不斷迭代,直至收斂,將每個(gè)點(diǎn)分到一個(gè)類中。其實(shí)隱馬爾科夫模型的訓(xùn)練和最大熵的訓(xùn)練都是期望最大化算法(EM)。首先,根據(jù)現(xiàn)有的模型,計(jì)算各個(gè)觀測(cè)數(shù)據(jù)輸入到模型中的計(jì)算結(jié)果,這個(gè)過程稱為期望值計(jì)算過程,或E過程;接下來,重新計(jì)算模型參數(shù),以最大化期望值,這個(gè)過程稱為最大化的過程,或M過程。優(yōu)化的目標(biāo)函數(shù)如果是個(gè)凸函數(shù),則一定有全局最優(yōu)解,若不是凸函數(shù),則可能找到的是局部最優(yōu)解。在以后的一些問題求解過程中,應(yīng)該考慮其是否是EM問題,也可以考慮參考這種思想,不斷迭代以優(yōu)化目標(biāo)的過程。

        第二十八章《邏輯回歸和搜索廣告》:雅虎和百度的競(jìng)價(jià)排名廣告并不比谷歌的根據(jù)廣告的預(yù)估點(diǎn)擊率來客觀的推送廣告收入多。點(diǎn)擊預(yù)估率有很多影響因素,一種有效的方法是邏輯回歸模型,邏輯回歸模型是一種將影響概率的不同因素結(jié)合在一起的指數(shù)模型。其訓(xùn)練方法和最大熵模型相似。同樣不是很理解其具體內(nèi)涵。

        第二十九章《各個(gè)擊破和Google云計(jì)算的基礎(chǔ)》:分而治之,各個(gè)擊破是一個(gè)很好的方法,Google開發(fā)的MapReduce算法就應(yīng)用了該方法。將一個(gè)大任務(wù)分成幾個(gè)小任務(wù),這個(gè)過程叫Map,將小任務(wù)的結(jié)果合并成最終結(jié)果,這個(gè)過程叫Reduce,該過程如何調(diào)度、協(xié)調(diào)就是工程上比較復(fù)雜的事情了。可見大量用到的、真正有用的方法往往簡(jiǎn)單而又樸實(shí)。

        附錄《計(jì)算復(fù)雜度》:計(jì)算機(jī)中復(fù)雜度是以O(shè)()來表示的,如果一個(gè)算法的計(jì)算量不超過N的多項(xiàng)式函數(shù),則稱算法為多項(xiàng)式函數(shù)復(fù)雜度的(P問題),是可以計(jì)算的。若比N的多項(xiàng)式函數(shù)還高,則是非多項(xiàng)式問題,實(shí)際上是不可計(jì)算的。非多項(xiàng)式問題中一種非確定的多項(xiàng)式問題(簡(jiǎn)稱NP),是科學(xué)家研究的焦點(diǎn),因?yàn)楝F(xiàn)實(shí)中好多問題都是NP問題。另外還有NP-Complete問題(NP問題可以在多項(xiàng)式時(shí)間內(nèi)規(guī)約到該問題)和NP-Hard問題,對(duì)于這兩種問題,需要簡(jiǎn)化找到近似解。

        整體上,《數(shù)學(xué)之美》這本書讓我了解了很多文本處理,數(shù)據(jù)挖掘相關(guān)的知識(shí),學(xué)到了很多。其中,簡(jiǎn)單美以及一些科學(xué)家的大師風(fēng)范讓我印象深刻!書中提到的一些思想(即道)讓我受益匪淺!

        《數(shù)學(xué)之美》讀書筆記 2

        最近看了這本《數(shù)學(xué)之美》,不得不感嘆一句,可惜早已身不在起點(diǎn)。

        我讀書的時(shí)候,數(shù)學(xué)成績(jī)一直都很好,雖然離開學(xué)校已經(jīng)10多年,自覺當(dāng)初的知識(shí)還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分?jǐn)?shù)。不過我也和大部分人一樣,覺得數(shù)學(xué)沒有太多用處,特別是高中和大學(xué)里面學(xué)的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,平時(shí)又有什么地方可以用呢?

        看了《數(shù)學(xué)之美》,驚嘆于數(shù)學(xué)的浩瀚和簡(jiǎn)單,說它浩瀚,是因?yàn)樗姆种Шw了科學(xué)的方方面面,是所有科學(xué)的理論基礎(chǔ),說它簡(jiǎn)單,無論多復(fù)雜的問題,最后總結(jié)的數(shù)學(xué)公式都簡(jiǎn)單到只有區(qū)區(qū)幾個(gè)符號(hào)和字母。

        這本書介紹數(shù)學(xué)理論在互聯(lián)網(wǎng)上的運(yùn)用,平時(shí)我們?cè)谑褂没ヂ?lián)網(wǎng)搜索或者翻譯功能的時(shí)候,時(shí)常會(huì)感嘆電腦對(duì)自己的了解和它的聰明,其實(shí)背后的原理就是一個(gè)個(gè)精美的算法和大量數(shù)據(jù)的訓(xùn)練。那些或者熟悉或者陌生的數(shù)學(xué)知識(shí)(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡(luò),隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。

        之所以覺得自己早已身不在起點(diǎn),是因?yàn)樯厦孢@些數(shù)學(xué)知識(shí),早已經(jīng)不在我的知識(shí)框架之內(nèi),就算曾經(jīng)學(xué)過,也不過是囫圇吞棗一樣的強(qiáng)記硬背,沒有領(lǐng)會(huì)過其中的真正意義。而今天想重頭在來學(xué)一次,其實(shí)已經(jīng)不可能了。且不說要花費(fèi)多少的精力和時(shí)間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡(jiǎn)單付出的。

        不像物理、化學(xué)需要復(fù)雜的.實(shí)驗(yàn)來驗(yàn)證,很多數(shù)學(xué)的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會(huì)聰明,我不否認(rèn),書本的確會(huì)提供很多知識(shí),可是不同的人讀同一本書也會(huì)有不同的收貨,這就限制于每個(gè)人的知識(shí)框架和認(rèn)知水平。就如一個(gè)數(shù)學(xué)功底好過我的人,看這本書,就會(huì)更容易理解里面的公式和推導(dǎo)出這些公式的其他運(yùn)用點(diǎn),而我,只能站在數(shù)學(xué)的門口,感嘆一句,它真的好美吧。

        當(dāng)然,我暫時(shí)無法在實(shí)際生活中運(yùn)用這些數(shù)學(xué)公式,可是書中提到的一些方法論,還是很有幫助的

        1)一個(gè)產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計(jì)學(xué)原理做自然語言處理。

        2)基礎(chǔ)知識(shí)和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗(yàn)證分析方法的好壞。

        3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;

        4)不要等一個(gè)東西完美了,才發(fā)布;

        5)簡(jiǎn)單是美,堅(jiān)持選擇簡(jiǎn)單的做法,這樣會(huì)容易解釋每一個(gè)步驟和方法背后的道理,也便于查錯(cuò)。

        6)正確的模型也可能受噪音干擾,而顯得不準(zhǔn)確;這時(shí)不應(yīng)該用一種湊合的修正方法加以彌補(bǔ),而是要找到噪音的根源,從根本上修正它。

        7)一個(gè)人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。

        《數(shù)學(xué)之美》讀書筆記 3

        《數(shù)學(xué)之美》,一個(gè)從事多年工作的谷歌研究員眼中的數(shù)學(xué)。令我大飽眼福的是,大學(xué)里面的數(shù)學(xué)知識(shí)竟能如此廣泛運(yùn)用到了計(jì)算機(jī)行業(yè)中。

        在語音識(shí)別、翻譯,還有密碼學(xué)領(lǐng)域,有著許多基于概率統(tǒng)計(jì)的模型和思想。當(dāng)然,貝葉斯公式是基礎(chǔ),應(yīng)用到隱含馬爾科夫鏈模型,神經(jīng)網(wǎng)絡(luò)模型。

        在搜索中,一些相關(guān)性的計(jì)算,無不用到了概率的知識(shí)。在新聞分類中,用到了一些有關(guān)矩陣特征值、相似對(duì)角化的知識(shí)。當(dāng)然,在圖像處理方面,矩陣變換可謂是無處不在。另外,在識(shí)別方面,有一些通信模型,涉及到了信道、誤碼率、信息熵。

        最近剛開學(xué)也沒什么事,所以就想隨便找?guī)妆緯匆幌,但最好別是那種太艱深晦澀的書。8月份一直到現(xiàn)在,吳軍寫的這本12年5月出版的《數(shù)學(xué)之美》一直盤踞京東、亞馬遜等各大網(wǎng)上商城科技類圖書的榜首,當(dāng)然,還有早些時(shí)候出版的《浪潮之巔》也排在很靠前的位置。心想市場(chǎng)的力量應(yīng)該能幫我挑出好書吧,于是就從圖書館借了一本來,一直到今天晚上把它給看完了。

        因此想寫一點(diǎn)東西來總結(jié)、反思一下,反正剛開完班會(huì)也沒什么事干。

        寫在前面的建議:如果你不討厭數(shù)學(xué)的話,強(qiáng)烈推薦這本書,網(wǎng)上也可以下到電子版,不過閱讀感覺上還是很不一樣的。

        廢話就不多說了,《數(shù)學(xué)之美》其實(shí)是一本科普類的讀物,所面向的是接受過普通高等教育的人,完全不需要在特定領(lǐng)域有很深的造詣就可以看懂,大概懂一點(diǎn)線性代數(shù)、概率統(tǒng)計(jì)、組合數(shù)學(xué)、信息論、計(jì)算機(jī)算法、模式識(shí)別最好(雖然列舉了這么多,其實(shí)有些不懂也沒關(guān)系……),所以尤其適合信科的人看。內(nèi)容大部分是和人工智能、計(jì)算機(jī)相關(guān)的,這并非我所學(xué)的專業(yè),但作者比較擅長(zhǎng)將看似復(fù)雜的原理用簡(jiǎn)明的語言表達(dá)出來,所以可讀性還是很好的。

        吳軍是清華大學(xué)畢業(yè)的,之前任職于Google,后來到了騰訊,這些文章都是發(fā)表在Google黑板報(bào)上的,后來經(jīng)過了重寫,所以網(wǎng)上下載的和書本內(nèi)容有所差異。由于吳軍本人是研究自然語言處理和語音識(shí)別的,所以統(tǒng)計(jì)語言模型的東西可能會(huì)多一點(diǎn),不過我覺得這絲毫不妨礙全書數(shù)學(xué)之美的展現(xiàn)……感覺收獲還是挺多的,知識(shí)上的有一些,但更多還是思維方式上的。作者舉了很多例子試圖讓人明白很多看似復(fù)雜的高科技背后,基本原理其實(shí)是出乎意料簡(jiǎn)單的(當(dāng)然,必須承認(rèn)第一個(gè)想到這些方法的人還是非常了不起的……)。比如高準(zhǔn)確率的機(jī)器翻譯,看上去好像是計(jì)算機(jī)能夠理解各國語言,隱藏在背后的卻是很多具有大學(xué)理科學(xué)歷的`人都非常清楚的統(tǒng)計(jì)模型和概率模型;再比如拼音輸入法的數(shù)學(xué)原理,早期的研究主要集中在縮短平均編碼長(zhǎng)度,比如曾經(jīng)流行一時(shí)的五筆輸入法,而現(xiàn)今真正實(shí)用的輸入法卻是有很多信息冗余、編碼長(zhǎng)度比較長(zhǎng)的拼音輸入法,作者從信息論和市場(chǎng)的角度做了簡(jiǎn)單的闡述;又比如新聞的自動(dòng)分類,許多非IT領(lǐng)域的人可能會(huì)認(rèn)為計(jì)算機(jī)可以讀懂新聞并進(jìn)行分類,而實(shí)際上只是特征向量的抽取、多維空間中向量夾角的計(jì)算,非常非常簡(jiǎn)單,但凡學(xué)過一點(diǎn)線性代數(shù)的人絕對(duì)是一看就懂的……當(dāng)然,完美的實(shí)現(xiàn)還需要考慮很多細(xì)節(jié)和現(xiàn)實(shí)的情況,但這并不是這本書所關(guān)注的地方,數(shù)學(xué)之美在于其簡(jiǎn)潔而不是繁瑣。

        除了對(duì)于具體信息技術(shù)的剖析之外,作者還花了很大篇幅來講一些杰出人士的成長(zhǎng)過程,特別是把這些人的成長(zhǎng)經(jīng)歷和中國學(xué)生的成長(zhǎng)經(jīng)歷作對(duì)比。雖然作者并沒有明說,但字里行間多少流露出對(duì)于中國高等教育以及很多中國企業(yè)的批評(píng),一是教育的功利性,缺乏寬松的獨(dú)立思考的環(huán)境,即使學(xué)了一堆理論也難有用武之地,自然也就缺乏創(chuàng)新性的成果;二是中國企業(yè)的短視,大部分都不舍得在新框架開發(fā)上投資,而是坐享學(xué)術(shù)界和國外企業(yè)的研究成果。

        總結(jié)一下呢,《數(shù)學(xué)之美》事實(shí)上不能帶給你編程能力的提升,也沒法讓人的數(shù)學(xué)水平有顯著的提升,但它在很大程度上讓你跳出教科書式的繁瑣細(xì)節(jié)的束縛,能夠從更宏觀的角度來思考信息世界背后的數(shù)學(xué)引擎的運(yùn)行原理,讓人明白看似很高級(jí)、復(fù)雜的東西背后其實(shí)并不如我們所想象的那樣復(fù)雜,而我們所學(xué)的“枯燥”的數(shù)學(xué)真的可以“四兩撥千斤”,改變億萬人的生活。

        《數(shù)學(xué)之美》讀書筆記 4

        人們發(fā)現(xiàn)真理的形式上從來都是簡(jiǎn)單的,而不是復(fù)雜和含混的。

        ——牛頓

        自小就學(xué)數(shù)學(xué)的我,并不覺得它是美好的。于我而言,數(shù)學(xué)就像緊箍咒一樣,不能提,一提。就頭疼。

        而看了吳軍博士所寫的《數(shù)學(xué)之美》后,我對(duì)數(shù)學(xué)的感覺,從以前的被動(dòng)獲取和勉強(qiáng)學(xué)習(xí),變成了強(qiáng)烈熱愛和主動(dòng)積極的學(xué)習(xí)。這原因就在于我發(fā)現(xiàn)了它的價(jià)值,它的一枝獨(dú)秀,不可或缺的地位,數(shù)學(xué)的博大精深和對(duì)其相關(guān)的各類事業(yè)的發(fā)展的價(jià)值已使我深深陶醉其中。這本書中有很多復(fù)雜且長(zhǎng)的公式,但這并不妨礙大眾的閱讀,因?yàn)樗⒎窃谟谧屇懔私飧郔T領(lǐng)域的知識(shí),而是用了大量篇幅介紹各個(gè)領(lǐng)域的典故,讓我們感受數(shù)學(xué)思維。這就像李欣教授所說:“成為一個(gè)領(lǐng)域的大師有其偶然性,但更有其必然性。其必然性就是大師們的思維方法!

        英國哲學(xué)家弗朗西斯·培根在《論美德》這篇文章中講:“美德就如同華貴的寶石,在樸素的襯托下最顯華麗!睌(shù)學(xué)的美妙,也恰恰在于一個(gè)好的思維,好的方法。

        在《數(shù)學(xué)之美》十四章,我被它的標(biāo)題吸引到了!坝嘞叶ɡ砗托侣劦姆诸悺保@倆看似八竿子打不著。卻有著緊密的聯(lián)系。可以說,新聞的分類很大程度上依賴的是余弦定理。我們都知道,計(jì)算機(jī)處理一個(gè)問題是讓他去算,而不是像人類一樣理解了它,再去解決。而科學(xué)家們遇到這個(gè)問題,卻用了另一種思維,他們把文字的新聞變成一組可計(jì)算的數(shù)字,然后再設(shè)計(jì)一個(gè)算法來算出任意兩篇新聞的'相似性。稍詳細(xì)一些就是:對(duì)于一篇新聞中的所有實(shí)詞。計(jì)算出它們的TF-IDF值,再把這些值按照其在對(duì)應(yīng)詞匯表的位置依次排列就得到一個(gè)向量,這即新聞的特征向量。這時(shí),就可以通過計(jì)算兩個(gè)向量夾角來判斷對(duì)應(yīng)的新聞主題的接近程度,這也就要用到余弦定理了。我在必修五數(shù)學(xué)書上學(xué)到余弦定理時(shí),很難想象它可以用來對(duì)新聞進(jìn)行分類。在這里我又一次看到了數(shù)學(xué)工具的用途。

        在書中,我也了解到了數(shù)學(xué)的發(fā)展實(shí)際上是不斷的抽象和概括的過程。這些抽象了的方法看似離生活越來越遠(yuǎn),但他們最終能找到應(yīng)用的地方,布爾代數(shù)便是如此。

        布爾代數(shù)的簡(jiǎn)單不能再簡(jiǎn)單了。運(yùn)算的元素只有兩個(gè)0和1,基本的運(yùn)算只有“與”、“或”和“非”。幾乎就是我們現(xiàn)在所學(xué)的“判斷命題真假”。在布爾代數(shù)提出后的80多年里,他確實(shí)沒有什么像樣的應(yīng)用。直到1938年香農(nóng)在他的碩士論文中指出,布爾代數(shù)來實(shí)現(xiàn)開關(guān)電路。才使得布爾代數(shù)成為數(shù)字電路的基礎(chǔ)。正是依靠這一點(diǎn),人類用一個(gè)個(gè)開關(guān)電路最終“搭出”電子計(jì)算機(jī)。

        這些,都能體現(xiàn)作者“簡(jiǎn)單即是美”的思想。他在書中也寫道:“數(shù)學(xué)的精彩之處就在于簡(jiǎn)單的模型可以干大事。”這些,也都是我從未感受到過的。并且,在這本書中,作者也用了不少篇幅來介紹通信領(lǐng)域的世界級(jí)專家,讓我對(duì)真正的世界級(jí)學(xué)者有更多的了解和理解,比如賈里尼克,Google AK-47的設(shè)計(jì)者——阿米特·辛格博士,自然語言處理的教父米奇·馬庫斯等等。

        愛因斯坦說過:“從希臘哲學(xué)到現(xiàn)代物理學(xué)的整個(gè)科學(xué)史中。不斷有人力圖地表面上極為復(fù)雜的自然現(xiàn)象歸結(jié)為幾個(gè)簡(jiǎn)單的基本概念和關(guān)系,這就是整個(gè)自然哲學(xué)的基本原理!边@本書把數(shù)學(xué)在IT領(lǐng)域的美麗予以了精彩表達(dá),我也知道,把一件復(fù)雜的事用簡(jiǎn)單的語言表達(dá)出來,并非易事,這應(yīng)該也是各界人士都對(duì)這本書予以好評(píng)的原因吧。

        當(dāng)然,我也明白,欣賞美不是終極目的,更值得我們追求的是創(chuàng)造美境界。

        還有,希望未來的自己,無論生活好與壞,都能少一點(diǎn)浮躁,多一點(diǎn)踏實(shí)和對(duì)自然科學(xué)本質(zhì)的好奇求知。

        《數(shù)學(xué)之美》讀書筆記 5

        我是在讀了吳軍博士的《浪潮之巔》之后,發(fā)現(xiàn)推薦了《數(shù)學(xué)之美》這本書。我到豆瓣讀書上看了看評(píng)價(jià),就果斷在當(dāng)當(dāng)上下單買了一本研讀。本來我以為這是一本充滿各種數(shù)學(xué)專業(yè)術(shù)語的書,讀后讓我非常震撼的是吳軍博士居然能用非常通俗的語言將自然語言處理等高深理論解釋的相當(dāng)簡(jiǎn)單。在李開復(fù)博士之后,吳軍博士又成為了目前備受矚目的具有深厚技術(shù)背景的作家。對(duì)于我來說,讀這本書有掃盲的功效,讓我知道了很多以前不知道的東西。我的想法是在研究生階段,不只局限于導(dǎo)師的研究方向,通過更加廣泛的涉獵知識(shí),去尋找一個(gè)自己喜歡的研究領(lǐng)域。如果找到了這樣一個(gè)領(lǐng)域,那么我就讀博士。如果沒有的話,那么我想還是工作算了。

        1、學(xué)科之間的聯(lián)系是如此的重要

        全書主要是圍繞著吳軍博士所研究的自然語言處理方向來講述一些應(yīng)用在這個(gè)研究領(lǐng)域的數(shù)學(xué)知識(shí),用了很大篇幅講解了將通信的原理應(yīng)用到自然語言處理上所取得的巨大成功。以前學(xué)習(xí)計(jì)算機(jī)網(wǎng)絡(luò)的時(shí)候,學(xué)過一個(gè)香農(nóng)定理。對(duì)香農(nóng)的認(rèn)識(shí)就從香農(nóng)定理開始,因?yàn)榭佳袝?huì)考相關(guān)的計(jì)算題?戳诉@本書才知道,香農(nóng)的《信息論》對(duì)今天的影響真的是不可估量。通過這樣一個(gè)過程,我也對(duì)以前的本科學(xué)校的學(xué)科建設(shè)產(chǎn)生了一些憂慮。對(duì)于培養(yǎng)計(jì)算機(jī)人才來說,無論是培養(yǎng)應(yīng)用型人才,還是培養(yǎng)研究型人才,都應(yīng)該與電子、通信有一定的'交叉,這樣對(duì)學(xué)生思考問題的啟發(fā)與視野的開闊有著重要的作用。計(jì)算機(jī)本身就是從電子、通信、數(shù)學(xué)等學(xué)科中抽出來的新興的學(xué)科,在發(fā)展了多年之后,我們發(fā)現(xiàn)它仍然需要繼承一些傳統(tǒng);叵胱约旱谋究扑哪,上的更多的課時(shí)語言類、技術(shù)類的課程,這些課程的確對(duì)提升學(xué)生的就業(yè)有很大幫助。但是我想說的是,一個(gè)忽視數(shù)學(xué)基礎(chǔ)、學(xué)科交叉的學(xué)校,他無法成為一所國內(nèi)的一流大學(xué)。作為一個(gè)母校培養(yǎng)的學(xué)生,我深知改革的阻力與困難,但是我希望母校的計(jì)算機(jī)學(xué)院能越辦越好。我們現(xiàn)在已經(jīng)培養(yǎng)出很多高薪優(yōu)秀的技術(shù)人才,我希望將來也能培養(yǎng)出更多的研究型人才。

        2、看起來很牛的東西卻用著難以置信的簡(jiǎn)單數(shù)學(xué)原理

        在整本書中讓我最為印象深刻的是解釋Google搜索的原理,居然就是簡(jiǎn)單的布爾代數(shù)運(yùn)算。這個(gè)的確讓我大跌眼鏡,我一直認(rèn)為搜索時(shí)一個(gè)非常復(fù)雜而龐大的問題,其數(shù)學(xué)原理也是相當(dāng)高深的,但是吳軍博士的解釋讓我大開眼界。與此同時(shí)也知道了Google為什么牛,牛在哪了。搜索的原理雖然非常簡(jiǎn)單,但是搜索是一個(gè)需要對(duì)海量數(shù)據(jù)進(jìn)行操作的工作。Google在海量數(shù)據(jù)的處理方面的確是相當(dāng)先進(jìn)的,MapReduce、BigTable等等一些技術(shù)的發(fā)明與應(yīng)用使得Google在搜索上無出其右。目前分布式存儲(chǔ)、分布式計(jì)算、數(shù)據(jù)倉庫與存儲(chǔ)等研究領(lǐng)域近些年來的大熱也說明Google在引領(lǐng)研究方向上的超凡本領(lǐng)。

        3、感謝概率老師的教誨

        在大二的時(shí)候,有一個(gè)在我們學(xué)生中聲望很高的概率老師,他在課程即將結(jié)束的時(shí)候跟我們說我們將的是前幾章,這些事概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)。對(duì)于你們計(jì)算機(jī)的學(xué)生來時(shí),后面的章節(jié)才是最有用的,以后一定要好好的研究,弄上一兩個(gè)在你的畢業(yè)設(shè)計(jì)上就會(huì)讓你畢業(yè)設(shè)計(jì)提升一個(gè)檔次,有可能驗(yàn)收你畢業(yè)設(shè)計(jì)的老師也不懂。我當(dāng)時(shí)對(duì)他的話沒有特別在意,我只關(guān)心期末考試要考哪些題目,因?yàn)槲夷莻(gè)學(xué)期的概率課基本上都在睡覺,只有他講笑話的時(shí)候不睡。我看《數(shù)學(xué)之美》后發(fā)現(xiàn)馬爾科夫鏈、貝葉斯網(wǎng)絡(luò)之后,對(duì)以前的概率老師充滿無限的敬意。我發(fā)現(xiàn)我們?cè)俦究齐A段學(xué)習(xí)的《高等數(shù)學(xué)》、《線性代數(shù)》、《概率論與數(shù)理統(tǒng)計(jì)》在計(jì)算機(jī)學(xué)科應(yīng)用較多的要數(shù)概率論與數(shù)理統(tǒng)計(jì),還有一門我學(xué)的不好的《離散數(shù)學(xué)》在計(jì)算機(jī)中也是有著舉足輕重的地位。我在看米歇爾的《機(jī)器學(xué)習(xí)》時(shí)也發(fā)現(xiàn)很多熟悉的概率論與數(shù)理統(tǒng)計(jì)的知識(shí),這讓我不得不開始考慮重新彌補(bǔ)自己的數(shù)學(xué)短板。我的想法是在研一這一年把概率論與數(shù)理統(tǒng)計(jì)、線性代數(shù)、離散數(shù)學(xué)盡我最大的努力補(bǔ)一補(bǔ),希望他們對(duì)我今后的學(xué)習(xí)有所幫助。

        4、說說作者吳軍博士

        吳軍博士寫的書對(duì)于學(xué)習(xí)計(jì)算機(jī)的學(xué)生來說,讀起來有種說不出的親切感?赡苓@跟他是技術(shù)出身的原因有關(guān),流暢的文筆、質(zhì)樸的文風(fēng)也讓人讀起來很舒服?锤邥运稍趦(yōu)酷上的《曉說》就知道,在硅谷有著眾多的華裔工程師,他們很多都來自清華、北大等國內(nèi)的名牌大學(xué),這些人在美國實(shí)現(xiàn)著自己的夢(mèng)想。吳軍博士也曾是這其中的一員,我非常希望那些像吳軍博士一樣的牛人們能夠?qū)憰蛘邅韲鴥?nèi)的大學(xué)做一些演講、論壇等等,開闊一下我們的視野,傳授一下做學(xué)問的經(jīng)驗(yàn)。與此同時(shí),我也在想為什么我們國家那么多優(yōu)秀的IT人才都去了美國。這個(gè)問題在我去蘋果公司在東軟信息學(xué)院組織的培訓(xùn)過程中得到了答案,那個(gè)南京郵電的老師講了講中國為什么不像美國那么有創(chuàng)造力。我們中國人并不缺乏創(chuàng)造力,很多時(shí)候是我們所處的外部環(huán)境恰恰阻礙了創(chuàng)新。我想那么多優(yōu)秀的清華北大學(xué)子紛紛到大洋彼岸的美國,正是被美國開放的學(xué)術(shù)環(huán)境、創(chuàng)新氛圍所吸引,每個(gè)人都有自己的夢(mèng)想,他們?nèi)ッ绹彩菫榱四軐?shí)現(xiàn)自己的夢(mèng)想。以前都覺得他們是不愛國,現(xiàn)在長(zhǎng)大了,對(duì)于這個(gè)問題看得更清楚了一點(diǎn)。我想說我們的祖國在經(jīng)歷了改革開放30多年的飛速發(fā)展之后,目前正處于一個(gè)關(guān)鍵和脆弱的時(shí)期。我們靠著人口紅利取得了巨大的成就,我們能不能憑借人才紅利取得更大的成就還是未知。希望有更多的人才能像李開復(fù)博士、吳軍博士那樣,為我們這個(gè)民族青年的成長(zhǎng)和國家發(fā)展做出貢獻(xiàn)。

        《數(shù)學(xué)之美》讀書筆記 6

        吳軍2012年的作品,源于其在谷歌黑板報(bào)的系列文章,講述數(shù)學(xué)方法在信息技術(shù)中的應(yīng)用,說明了為什么科學(xué)研究中方法論如此的重要,以及數(shù)學(xué)如何簡(jiǎn)單優(yōu)雅地解決問題,直達(dá)本質(zhì)。對(duì)比他的其他作品比如《浪潮之巔》、《硅谷之謎》,本書比較偏技術(shù),屬于目前大熱的數(shù)據(jù)科學(xué)(Data Science)范疇,在云計(jì)算、大數(shù)據(jù)和人工智能等成為常態(tài)和趨勢(shì)的今天,適合所有對(duì)IT技術(shù)及相關(guān)管理人員閱讀。對(duì)我而言,最大的收獲包括:

        規(guī)則vs.算法:自然語言處理,在早期幾十年基于文法規(guī)則都無法達(dá)到可應(yīng)用的效果,終于在轉(zhuǎn)變?yōu)榛诮y(tǒng)計(jì)方法且積累了足夠數(shù)據(jù)后,形成了突破,達(dá)到了今日可大規(guī)模商用的'效果。再次說明了數(shù)據(jù)及算法在今日的重要性。

        一些常見應(yīng)用涉及的優(yōu)化算法:搜索相關(guān)(分詞、網(wǎng)絡(luò)爬蟲、索引、結(jié)果排名、廣告及反作弊)、文本處理(新聞分類、廣告相關(guān)性、輸入法)、地圖路線規(guī)劃、信息指紋、密碼學(xué)等。這些算法不止適用于這些應(yīng)用場(chǎng)景,還可以在其他許多地方借鑒,比如用戶評(píng)論分析也需要用分詞和語義分析,許多價(jià)值優(yōu)化算法都需要用到期望值最大化和邏輯回歸等。

        優(yōu)雅的理論模型:在初始階段,出于時(shí)間和成本考慮,在技術(shù)實(shí)現(xiàn)上可能會(huì)使用一些拼湊的方法,甚至山寨,但是這種方法并不可持續(xù),很難進(jìn)行系統(tǒng)化的優(yōu)化,開發(fā)維護(hù)成本都很高,最終會(huì)遇到災(zāi)難性問題。做事情需要有境界,最求簡(jiǎn)單而優(yōu)雅的理論和工程實(shí)現(xiàn),這在長(zhǎng)期是非常有好處的。

        吳軍使用淺顯易懂的語言,把解決問題的思路和復(fù)雜的數(shù)學(xué)模型講得很清楚,雖然理解延伸閱讀里的具體數(shù)學(xué)公式還是有些挑戰(zhàn)。其實(shí)重要的是思想和方法,具體的實(shí)現(xiàn)可以在用到時(shí)再進(jìn)一步的了解。如何用簡(jiǎn)單的語言把復(fù)雜的技術(shù)講清楚,也是我工作的需要,要不斷學(xué)習(xí)磨練。書里提到了啟發(fā)吳軍這方面能力的兩本書,即《從0到無窮大》和《時(shí)間簡(jiǎn)史》,會(huì)有要去看下。

        《數(shù)學(xué)之美》讀書筆記 7

        上個(gè)月去北京開會(huì),順道拜訪了人民郵電出版社,合作多年的編輯陳冀康贈(zèng)我一本《數(shù)學(xué)之美》,說一定是我喜歡看的類型。以前也在網(wǎng)上零散看過Google黑板報(bào)上吳軍先生的文章,對(duì)他的前一本書《浪潮之顛》也有耳聞,但沒有讀過。這次有機(jī)會(huì)集中閱讀他的文章,確實(shí)是一段美妙的體驗(yàn)。

        讀完這本書有一點(diǎn)強(qiáng)烈的感受:工具一定要先進(jìn)。數(shù)學(xué)是強(qiáng)大的工具,計(jì)算機(jī)也是。這兩種工具結(jié)合在一起,造就了強(qiáng)大的google、百度、亞馬遜、阿里、京東、騰迅等公司。他們不是百年老店,但他們掌握了先進(jìn)的工具。

        掌握了先進(jìn)的工具,必將獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。如果你知道哪里有一群軟件工程師,維護(hù)著更大的一群計(jì)算機(jī),那么不要猶豫,想辦法使用他們提供的服務(wù),因?yàn)檫@會(huì)給你帶來優(yōu)勢(shì)。所以我們使用Google的搜索和郵件,在亞馬遜、京東和淘寶上購物,用QQ和微博聯(lián)系朋友,使用銀行卡和網(wǎng)上銀行,利用交易終端在全球市場(chǎng)上進(jìn)行各種交易……

        人類歷史就是一部工具的進(jìn)化史。石器、青銅、鐵器、火藥、蒸汽機(jī)、內(nèi)燃機(jī)、電報(bào)、電話、電視、計(jì)算機(jī)、衛(wèi)星、互聯(lián)網(wǎng),工具的進(jìn)步引領(lǐng)著文明的進(jìn)步。新的工具不斷淘汰老的工具,就像互聯(lián)網(wǎng)視頻點(diǎn)播正在淘汰電視、微博正在淘汰報(bào)紙、電子書正在淘汰紙質(zhì)書那樣。

        但有一些古老的工具,今天仍有人在學(xué)習(xí)和使用,甚至在上面花費(fèi)許多時(shí)間。毛筆就是這樣一個(gè)例子。今天學(xué)習(xí)掌握毛筆這種“落后的”工具,還有什么意義?其實(shí)我們?cè)谑褂靡恍奥浜蟮摹惫ぞ邥r(shí),主要是在學(xué)習(xí)工具背后的思想。書法和繪畫中蘊(yùn)含的藝術(shù)審美的一般原則,經(jīng)得起具體工具變遷的考驗(yàn)。甲骨文、金文、石鼓文所包含的對(duì)空間構(gòu)圖的理解,仍然值得現(xiàn)代人學(xué)習(xí)。思想工具是比實(shí)物工具更強(qiáng)大的工具。

        工具組合使用,形成更強(qiáng)大的新工具。《數(shù)學(xué)之美》中提到的馬爾可夫鏈雖然是很強(qiáng)大的工具,但我在數(shù)學(xué)課上沒有聽老師提到過。這本書中給我印象最深的例子是余弦定理和新聞分類。余弦定理是中學(xué)數(shù)學(xué),再加上一些不算很難的多維向量的知識(shí),竟然解決了計(jì)算機(jī)新聞分類這樣的難題!

        每一種工具的背后,是人們對(duì)世界的一種理解。蒸汽機(jī)和內(nèi)燃機(jī)背后,是力學(xué)的世界。電報(bào)、電話、電視、計(jì)算機(jī)和互聯(lián)網(wǎng)背后,是信息的世界。數(shù)學(xué)是抽象的工具,是其他工具背后的工具。每一門學(xué)科要成為科學(xué),都少不了數(shù)學(xué)。也許有一天人們會(huì)習(xí)慣,用數(shù)學(xué)工具來分析藝術(shù)。數(shù)學(xué)是一種語言,它源于具體的世界,又高于具體的世界。如果說語言是對(duì)世界的認(rèn)識(shí)和描述,如果說數(shù)學(xué)是一種語言,那么它一定是最接近神的語言?此坪敛幌嚓P(guān),卻又能描述萬事萬物。

        學(xué)習(xí)數(shù)學(xué)有什么用?物理學(xué)家費(fèi)曼當(dāng)年在大一時(shí)提出這個(gè)問題,他的師兄建議他轉(zhuǎn)到物理系。今天,這個(gè)問題已不成為問題。具有扎實(shí)數(shù)學(xué)功底的人才正進(jìn)入各行各業(yè),例如金融業(yè)。我認(rèn)識(shí)一個(gè)出版社的老總,他招應(yīng)屆畢業(yè)生有一個(gè)條件:數(shù)學(xué)要好。

        工具雖好,關(guān)鍵還要會(huì)用。最終要回到掌握先進(jìn)工具的人。軟件算法工程師加上計(jì)算機(jī)集群,這是目前一流企業(yè)必需的裝備。正如馬克.安德森所說的,各行各業(yè)的一流公司,都是軟件公司。優(yōu)秀的`軟件算法工程師,是人才爭(zhēng)奪的焦點(diǎn)。這樣,我們就容易理解Google招工程師的要求。

        對(duì)信息加工處理和傳遞的能力不斷增強(qiáng),是知識(shí)經(jīng)濟(jì)的特點(diǎn)!稊(shù)學(xué)之美》展示了Google如何運(yùn)用數(shù)學(xué)和計(jì)算機(jī)網(wǎng)絡(luò),帶領(lǐng)我們進(jìn)入云計(jì)算和大數(shù)據(jù)時(shí)代。

        知識(shí)經(jīng)濟(jì)時(shí)代的工作,就是在各自的領(lǐng)域中進(jìn)行科學(xué)研究。科學(xué)研究要大膽假設(shè),小心求證?茖W(xué)研究要量化?茖W(xué)研究要有對(duì)比實(shí)驗(yàn)?茖W(xué)研究要有數(shù)學(xué)模型?茖W(xué)研究要有田野調(diào)查?茖W(xué)研究要有文獻(xiàn)查證?茖W(xué)研究要有同行評(píng)議!稊(shù)學(xué)之美》向我們介紹了自然語言分析領(lǐng)域的科研方法和過程。

        任何一個(gè)領(lǐng)域,深入進(jìn)去都有無數(shù)的細(xì)節(jié)。有興趣的人不但沒被這些細(xì)節(jié)嚇倒,反而會(huì)興致勃勃地研究,從而達(dá)到令人仰慕的高度。吳軍先生向我們展示了數(shù)學(xué)和算法中的這些細(xì)節(jié),也展示了他所達(dá)到的高度。值得我學(xué)習(xí)。

        感謝吳軍先生分享他的知識(shí)和深刻見解,也感謝人民郵電出版社出了這樣一本好書。

        《數(shù)學(xué)之美》讀書筆記 8

        重復(fù)的體力勞動(dòng)已經(jīng)被機(jī)器取代,重復(fù)的腦力勞動(dòng)也將被AI取代。

        目前的`算法更多的是從統(tǒng)計(jì)學(xué)、概率論角度來執(zhí)行,其算法依靠人為設(shè)定執(zhí)行,今后AI的介入,算法會(huì)趨于自我迭代、自我演化。

        就整體而言機(jī)器的搜索、篩選、分析、邏輯推理等,都是基于當(dāng)前情況最大概率決策。即通過算法計(jì)算下一步所有可能情況的概率分布,然后得出實(shí)現(xiàn)目標(biāo)哪種決策成功概率最高,即為下一步的方案。

        在這種環(huán)境下人最好的方式便是與機(jī)器合作,將資源分配到這些大概率事件上,當(dāng)然也會(huì)有一部分人懷有賭徒心態(tài),將資源,甚至全部資源分配到小概率事件上,幻想出現(xiàn)奇跡,而這件事就叫“創(chuàng)新”。

        但“創(chuàng)新”才是真正的未來,因?yàn)閺挠钪娼嵌葋砜,人類誕生的幾率不到萬億分之一,而這是多么偉大的奇跡,又是多么偉大的創(chuàng)新!

        《數(shù)學(xué)之美》讀書筆記 9

        本書介紹了Google產(chǎn)品中涉及的自然語言處理、統(tǒng)計(jì)語言模型、中文分詞、信息度量、拼音輸入法、搜索引擎、網(wǎng)頁排名、密碼學(xué)等內(nèi)容背后的數(shù)學(xué)原理。讓我們看到了布爾代數(shù)、離散數(shù)學(xué)、統(tǒng)計(jì)學(xué)、矩陣計(jì)算、馬爾科夫鏈等似曾相識(shí)的內(nèi)容在實(shí)際生活中的應(yīng)用。相比于其他數(shù)學(xué)題材書籍,吳軍老師把抽象、深?yuàn)W的數(shù)學(xué)方法解釋得通俗易懂,書中同時(shí)引用了諸多的歷史典故和人物介紹,給人以很多啟發(fā),也讓人由衷感嘆數(shù)學(xué)的簡(jiǎn)潔和強(qiáng)大。

        雖是數(shù)據(jù)專業(yè)畢業(yè),但是才疏學(xué)淺,無力對(duì)數(shù)學(xué)的美進(jìn)行闡述。僅就書中兩個(gè)比較喜歡的地方發(fā)表一點(diǎn)不成熟的`見解,與諸位共勉。

        其一,在講Google的搜素引擎反作弊時(shí)談到做事情的兩種境界“道”和“術(shù)”,術(shù)就是具體的做事方法,而道則是隱藏在問題背后的動(dòng)機(jī)和本質(zhì)。在術(shù)這個(gè)層面解決問題要付出更多的努力,有點(diǎn)類似于我們常說的“頭疼醫(yī)頭,腳疼醫(yī)腳”,暫時(shí)不疼了,過幾天復(fù)發(fā)了,再去醫(yī)治,如此往復(fù),無法從根本上解決;而只有找到了致病原因,才能做到藥到病除,根本治愈。本人之前參與過行內(nèi)月終自動(dòng)核對(duì)的研發(fā),月終核對(duì)初期數(shù)據(jù)的不一致性只能靠數(shù)百業(yè)務(wù)人員人工核對(duì)數(shù)據(jù)差異,然后修改數(shù)據(jù),每月1日都要加班加點(diǎn),工作量很大,這是從術(shù)上解決問題。后來找到了產(chǎn)生差異的原因是會(huì)計(jì)核算時(shí)的利息調(diào)整造成的,把這些數(shù)據(jù)接過來進(jìn)行相應(yīng)沖減后差異就消失了,業(yè)務(wù)人員也不用來加班了,這才是從道上解決問題。

        其二,是在做中文網(wǎng)頁排名時(shí)提到的從業(yè)界成功的秘訣之一:“先幫助用戶解決80%的問題,再慢慢解決剩下的20%的問題。許多時(shí)候做事失敗,不是因?yàn)槿瞬粔騼?yōu)秀,而是做事的方法不對(duì)。一開始追求大而全的解決方案,之后長(zhǎng)時(shí)間不能完成,最后不了了之”。我們?cè)谧鲰?xiàng)目時(shí)也是一樣,業(yè)務(wù)有時(shí)要的功能非常急,可能有些功能也實(shí)現(xiàn)不了(比如系統(tǒng)響應(yīng)時(shí)間長(zhǎng)、查詢明細(xì)不能支持省行等)。這時(shí)我們就要將焦點(diǎn)關(guān)注在那些可以實(shí)現(xiàn)的80%的功能上,哪怕剛剛上線的系統(tǒng)界面丑點(diǎn),操作復(fù)雜點(diǎn),反應(yīng)速度慢點(diǎn),但是至少業(yè)務(wù)有可用的系統(tǒng),剩下時(shí)間再去優(yōu)化那剩下的20%。這樣可以幫助我行搶占先機(jī),在與同行業(yè)的競(jìng)爭(zhēng)中取得主動(dòng)。如果等待我們把所有的細(xì)節(jié)都搞清楚再動(dòng)手開發(fā),力求完美,那么很可能系統(tǒng)能夠上線的時(shí)候業(yè)務(wù)已經(jīng)不需要了。

        數(shù)學(xué)之美,也就是簡(jiǎn)單之美。希望大家能夠喜歡數(shù)學(xué),喜歡數(shù)學(xué)之美。

        《數(shù)學(xué)之美》讀書筆記 10

        這本書一共3章,主要介紹了這些數(shù)學(xué)方法:統(tǒng)計(jì)方法、統(tǒng)計(jì)語言模型、中文信息處理、隱含馬爾科夫模型、布爾代數(shù)、圖論、網(wǎng)頁排名技術(shù)、信息論、動(dòng)態(tài)規(guī)劃、余弦定理、矩陣運(yùn)算、信息指紋、密碼學(xué)、搜索技術(shù)、數(shù)學(xué)模型、最大熵模型、拼音輸入法、貝葉斯網(wǎng)絡(luò)、句法分析、維特比算法、各個(gè)擊破算法等。從第一章開始其明了幽默的語言就深深的吸引了我,讓我覺得如果早一點(diǎn)看這本書,也許數(shù)學(xué)之于我就是另一番天地。

        第一章里作者從原始人類的通信方式開始入手,人類最早利用聲音進(jìn)行的通信依賴于開篇給出的"編碼-傳輸-解碼"的基本原理,指出原始人的通信方式和今天的通信方式?jīng)]什么不同,這世界上近現(xiàn)代最普遍的原理大部分都在人類發(fā)展的歷史上被無意識(shí)的`使用著。

        第六章信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。

        這本書里也能找到不少在學(xué)的課程知識(shí),如大學(xué)專業(yè)課里,數(shù)電總是要比模電簡(jiǎn)單不少,而自然界里大部分的信號(hào)都屬于模擬信號(hào)。所謂模擬信號(hào),是指從時(shí)間和數(shù)值兩種維度上看來都是連續(xù)變化的信號(hào)。在實(shí)際電路中,模數(shù)轉(zhuǎn)換是一個(gè)很重要的過程,將預(yù)處理的模擬信號(hào)經(jīng)過模數(shù)變換為數(shù)字信號(hào),然后進(jìn)行數(shù)字信號(hào)處理。而數(shù)字化處理有很多優(yōu)點(diǎn),比如功能強(qiáng)大、抗干擾能力強(qiáng)、易于傳輸?shù)取?/p>

        簡(jiǎn)而言之,如果沒有數(shù)學(xué),就沒有數(shù)字信號(hào)處理和傳輸?shù)母拍,而?shù)字信號(hào)傳輸在當(dāng)下大規(guī)模的集成電路里是必不可少的,這是通信成功的基本要求。

        作者把生活中遇到的復(fù)雜的問題,以簡(jiǎn)單清晰,直觀的模型或者公式展現(xiàn)出來。我們可能過于注意生活中的種種奇妙現(xiàn)象,往往忽略了追求其理論邏輯的演繹,而這,也是大部分問題的主要根源。

        羅素曾經(jīng)說過:"數(shù)學(xué),如果正確地看,不但擁有真理,而且也具有至高的美";愛因斯坦也曾說過:"純數(shù)學(xué)使我們能夠發(fā)現(xiàn)概念和聯(lián)系這些概念的規(guī)律,這些概念和規(guī)律給了我們理解自然現(xiàn)象的鑰匙。"數(shù)學(xué)在所有科學(xué)領(lǐng)域起著基礎(chǔ)和根本的作用。"哪里有數(shù),哪里就有美"。在這里,我也想把《數(shù)學(xué)之美》真誠推薦給每一位對(duì)自然、科學(xué)、生活有興趣有熱情的朋友,不管你是從事職業(yè),讀一讀它,會(huì)讓你受益良多。

        吳軍老師在《數(shù)學(xué)之美》中提到:"這本書的目的是講道而不是講術(shù)。很多具體的搜索技術(shù)很快會(huì)從獨(dú)門絕技到普及,再到落伍,追求術(shù)的人一輩子工作很辛苦。只有掌握了搜索的本質(zhì)和精髓才能永遠(yuǎn)游刃有余".回到我們?nèi)粘5纳钪,需要學(xué)習(xí)的東西、技術(shù)太多太多,如果一味地只為去追技術(shù)的腳步,那么我們也會(huì)很累很累。然而基本的原理卻是沒有怎么變化的。只見森林,不見樹木,難免迷失;站在高處向下看,也許我們一直看不到底,但是站在底處卻是可以看見底的。

        《數(shù)學(xué)之美》讀書筆記 11

        我在想,為什么我們要學(xué)習(xí)數(shù)學(xué)?也許這個(gè)問題成年人有一萬個(gè)答案,可是當(dāng)我們第一次走進(jìn)教室,學(xué)習(xí)數(shù)學(xué)的時(shí)候,大概率還是個(gè)孩子,你怎么跟一個(gè)孩子解釋為什么要學(xué)習(xí)數(shù)學(xué)呢?我把這個(gè)問題拋給了一個(gè)朋友,他說:“為了提高思維邏輯能力,這是我初中老師在第一節(jié)數(shù)學(xué)課上告訴我們的”;蛘咭晃5歲的小朋友又會(huì)問:“什么是邏輯能力呢?”

        也許從出生第一天,我們就一直在被動(dòng)的接收一些東西,父母的勸導(dǎo),老師的傳授,可5歲的孩子還是會(huì)把玩具散落一地,6歲的孩子仍然會(huì)因?yàn)楦改覆唤o買玩具而嗷嗷大哭,無論你怎么勸導(dǎo)一個(gè)人,怎么勸誡一個(gè)人,他可能仍然會(huì)犯你認(rèn)為會(huì)出現(xiàn)的錯(cuò)誤。我記得有位教育專家這么說:“你告訴寶寶他把玩具弄壞了,就等于丟了10個(gè)棒棒糖”,從此以后這個(gè)寶寶可能會(huì)更加珍惜玩具。這個(gè)方法很簡(jiǎn)單,但是貌似最有效。數(shù)學(xué)是什么?數(shù)學(xué)不就是把復(fù)雜的東西簡(jiǎn)單化么?

        現(xiàn)在我們?cè)倩卮鹎懊娴膯栴}:為什么我要學(xué)習(xí)數(shù)學(xué)?我們可以這么跟5歲的小朋友說:“媽媽給你10元錢,讓你買醬油,醬油7元、棒棒糖1元一個(gè),剩下的'錢你可以買幾個(gè)棒棒糖?”或許想吃棒棒糖的就會(huì)苦思冥想一番,或許未來媽媽真的給他10元錢去買醬油,結(jié)果回來就變成了一瓶醬油和3個(gè)棒棒糖;蛘咴龠^一段時(shí)間,這位小朋友會(huì)選擇6元的醬油,因?yàn)榭梢垣@得4個(gè)棒棒糖了。他這么計(jì)算著:7+3和6+4都可以等于10,那么如果要必須買醬油的情況下,1+9也可以等于10。我們都知道也有1元的袋裝醬油,于是9個(gè)棒棒糖到手了。任何知識(shí)的魅力都在于自我的發(fā)現(xiàn),只有你對(duì)它產(chǎn)生了無限的興趣,你就會(huì)不斷的發(fā)現(xiàn)它的美,《數(shù)學(xué)之美》也可以變成《物理之美》。

        有些人會(huì)說,上面的例子是利益驅(qū)動(dòng)型,不是興趣驅(qū)動(dòng)型,對(duì)于一個(gè)孩子來說,你能指望他向成人那樣:“我需要的不是物質(zhì)世界,我需要的是精神世界?”。5歲寶寶最喜歡做得事情就是在吃和玩上面,請(qǐng)問,成年人不也是如此么?這就是天性。只不過成年人的自控能力足夠大罷了。

        我們回到書本上,這本書是否合適自己?如果沒有專業(yè)的數(shù)學(xué)知識(shí),很難讀懂。但是它又有著無限的魅力,讓你不自覺的讀下去,為什么?因?yàn)椤皵?shù)學(xué)之美”,雖然大多數(shù)人看不懂里面的公式,但是能夠明白數(shù)學(xué)能解決的問題:概率統(tǒng)計(jì)學(xué)能夠解決自然語言處理、布爾代數(shù)能解決搜索引擎的問題、有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃能解決地圖問題、向量+特征向量+余弦定理能解決自動(dòng)新聞分類問題、最大熵模型解決金融問題,看著看著我就莫名的產(chǎn)生了一種想要學(xué)習(xí)算法的沖動(dòng),這不就是本書的意義所在么?

        最后,我推薦幾個(gè)章節(jié)希望有興趣的讀者可以關(guān)注下:

        1. 信息指紋,可以讓復(fù)雜的數(shù)據(jù)用簡(jiǎn)單的一串?dāng)?shù)字存儲(chǔ)

        2. 13章,提到的簡(jiǎn)單之美。當(dāng)然之后多次提到

        3. 余弦定理(通過向量+特征向量+余弦定理)可以判斷兩條數(shù)據(jù)的相似性

        4. 17章,簡(jiǎn)單密碼學(xué)(對(duì)密碼感興趣的可以看看)

        5. 布隆過濾器,用很少的空間存儲(chǔ)大量的數(shù)據(jù),從而解決黑名單的問題(黑名單數(shù)據(jù)量龐大的時(shí)候,會(huì)增加判斷某一個(gè)名單是否出現(xiàn)過的難度)。

        6. 29章,分治算法,雖然沒有很明白算法,但是原理其實(shí)很簡(jiǎn)單:把復(fù)雜的東西拆分成若干小的部分,然后進(jìn)行逐個(gè)解決或者說各個(gè)擊破

        7. 30章,神經(jīng)網(wǎng)絡(luò),其實(shí)沒那么神秘,神經(jīng)就好比一個(gè)網(wǎng)絡(luò)(馬爾科夫模型+貝葉斯網(wǎng)絡(luò))中的各個(gè)節(jié)點(diǎn)而已。

        8. 31章,大數(shù)據(jù),這章是最推薦看的,而且沒有很多專業(yè)的知識(shí),一看就懂。不是什么都可以稱之為大數(shù)據(jù)的,大數(shù)據(jù)需要滿足幾個(gè)條件:數(shù)據(jù)的代表性、數(shù)據(jù)的多維度、數(shù)據(jù)的完備性。現(xiàn)在有很多公司都自稱自己有大數(shù)據(jù),請(qǐng)不要侮辱大數(shù)據(jù)這個(gè)詞。順便說一下像百度這樣的公司,近幾年都在大數(shù)據(jù)上深耕,據(jù)我了解,比如醫(yī)療上面的項(xiàng)目,寧可免費(fèi)做,只要求能夠得到醫(yī)療方面的大數(shù)據(jù),可見其對(duì)大數(shù)據(jù)的重視程度。

      【《數(shù)學(xué)之美》讀書筆記】相關(guān)文章:

      關(guān)于數(shù)學(xué)之美教學(xué)設(shè)計(jì)(通用12篇)03-17

      《橋之美》教學(xué)設(shè)計(jì)04-24

      《橋之美》教學(xué)設(shè)計(jì)新版01-22

      朱光潛《談美》的讀書筆記02-21

      《積極心態(tài)之美》直播心得感受10-08

      四季之美教學(xué)設(shè)計(jì)10-03

      朱光潛《談美書簡(jiǎn)》讀書筆記01-30

      數(shù)學(xué)讀書筆記07-22

      《傅雷家書》讀書筆記之四09-14

      《談美書簡(jiǎn)》讀書筆記1200字(精選10篇)07-25