大數(shù)據(jù)挖掘初讀感想
這篇文章是小編大學(xué)上課時交的一篇作業(yè),對,就是一篇表達(dá)小編完全沒理工細(xì)胞的感想日志,哈哈哈哈哈哈~所以小編后來就離技術(shù)之路越來越遠(yuǎn)了~~
上課的時候聽了很多有關(guān)大數(shù)據(jù)的項目,心里默默地崇敬起來,于是課后也去網(wǎng)上找了老師說的大數(shù)據(jù)創(chuàng)新與創(chuàng)業(yè)大賽:第一屆大數(shù)據(jù)技術(shù)創(chuàng)新與創(chuàng)業(yè)大賽——基于出租車GPS軌跡的位置服務(wù)。看了一下題目就懵了,連題目都沒看懂到底要干什么!?瀏覽了一下樣例,一開始以為類似ACM,結(jié)果一路看下去,除了看出獎勵很高以外幾乎都沒看懂。
可以肯定,這東西跟數(shù)學(xué)和算法有關(guān),而且很難!
既然很難,那么就要付出更大的努力去學(xué)習(xí)了,去圖書館找書,找了好久發(fā)現(xiàn)老師經(jīng)常說的.hadoop都被借完了,只好找了本《數(shù)據(jù)挖掘教程》//《Data Mining A Tutorial-Based Primer》,看起來比較入門,借著平時空閑的時間翻閱了一下,數(shù)據(jù)挖掘,顧名思義就是挖掘數(shù)據(jù)中有用的信息,幫助解釋當(dāng)前行為或預(yù)測未來的結(jié)果。對于數(shù)據(jù)挖掘的含義,雖然聽多了也耳熟的很,也還是看了書才知道到底是干什么的。這幾天也看了些,雖然不是看得特別懂,就是了解了一下數(shù)據(jù)挖掘的研究方面及應(yīng)用領(lǐng)域,瀏覽了一下各種例子中的算法,
初看數(shù)據(jù)挖掘的應(yīng)用,我想也就商業(yè)上用的比較多吧,沒想到醫(yī)藥衛(wèi)生自然科學(xué)也有它的身影,讓我有些意外,仔細(xì)讀來,發(fā)現(xiàn)確實,各種數(shù)據(jù)會形成一種特定的模式或規(guī)律,如地球資源探測衛(wèi)星圖像數(shù)據(jù)集,這個數(shù)據(jù)集包括了表示一部分地球表面的數(shù)字化衛(wèi)星圖像的像素點,每個實例分類到15個類別中的一個,由于每個類都包括巨大的數(shù)據(jù)量,分類的準(zhǔn)確度受到了特定模型參數(shù)設(shè)置的影響。除了自然科學(xué),還有醫(yī)藥衛(wèi)生中心臟病患者數(shù)據(jù)集,脊柱臨床數(shù)據(jù)集等,甚至包括泰坦尼克號數(shù)據(jù)集!
說到數(shù)據(jù)挖掘,自然想到數(shù)據(jù)庫,書上還真有說到數(shù)據(jù)庫,KDD——數(shù)據(jù)庫中的知識發(fā)現(xiàn),很專業(yè)的術(shù)語,感覺和數(shù)據(jù)挖掘差不多,不過KDD處理模型中還包括一個方法論,用來提取和準(zhǔn)備數(shù)據(jù),以及數(shù)據(jù)挖掘執(zhí)行后對所要采取的行動做出決策。——其實我真沒看懂。
大部分理論和概念都沒怎么看懂,可能是剛開始接觸,還生疏,理解起來挺難的,書上提到可以為數(shù)據(jù)創(chuàng)建決策樹,可以概化數(shù)據(jù),總結(jié)各數(shù)據(jù)屬性間的關(guān)系,看上去一目了然。不過要我自己來弄估計還得弄好長一段時間,理解了和自己能動手做畢竟還有段距離。
看了幾天書,其實也沒看懂多少,就大概了解了一下數(shù)據(jù)挖掘的一些關(guān)鍵術(shù)語,如果說收獲的話,應(yīng)該是建立了一種思維模式吧,也許還不算正式形成了,不過對生活中的一些數(shù)據(jù)會多留意,會想是不是可能產(chǎn)生什么聯(lián)系,不過這也是想象而已啦,還是要多看下書,慢慢會理解的,對數(shù)學(xué)、算法這類學(xué)科會有一個針對性的學(xué)習(xí)。
【大數(shù)據(jù)挖掘初讀感想】相關(guān)文章:
數(shù)據(jù)收集比數(shù)據(jù)挖掘有意義07-15
數(shù)據(jù)挖掘工程師的職責(zé)內(nèi)容09-27
初進(jìn)公司的感想與體會06-21
初級經(jīng)濟(jì)師重點知識:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘08-13
讀苔絲感想08-06
初讀老師小學(xué)作文04-02