數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)主要是關(guān)于什么的學(xué)科(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的專(zhuān)業(yè)介紹)
一段時(shí)間以來(lái),我一直對(duì)數(shù)據(jù)科學(xué)家如何更好地相互交流他們的數(shù)據(jù)分析活動(dòng)以及與領(lǐng)域外的人交流感興趣。在我看來(lái),我們目前的方法是不夠的,因?yàn)樗鼈兇蠖嗍菑钠渌I(lǐng)域(尤其是計(jì)算機(jī)科學(xué))借用的。其中許多工具都很有用,但它們并不是專(zhuān)門(mén)為傳達(dá)數(shù)據(jù)分析概念而設(shè)計(jì)的,并且常常存在不足。今年早些時(shí)候,我在院長(zhǎng)講座中談到了這個(gè)問(wèn)題,以及數(shù)據(jù)科學(xué)領(lǐng)域如何從發(fā)展自己的理論中受益,以像其他領(lǐng)域一樣簡(jiǎn)化通信。
我在其他領(lǐng)域注意到的一件事是,這些領(lǐng)域的發(fā)展可以部分視為日益專(zhuān)業(yè)化的趨勢(shì)。隨著一個(gè)領(lǐng)域的人們?cè)谀硞€(gè)子專(zhuān)業(yè)上變得更加專(zhuān)業(yè),專(zhuān)家需要相互溝通和協(xié)調(diào)才能生產(chǎn)出完整的產(chǎn)品。隨著時(shí)間的推移,將一個(gè)領(lǐng)域劃分為一組專(zhuān)家會(huì)推動(dòng)通信工具的開(kāi)發(fā),這些工具可作為雙方商定的信息交換所。如果沒(méi)有足夠的工具,增加項(xiàng)目人員所涉及的溝通成本將變得太大,整個(gè)企業(yè)可能會(huì)崩潰。FredBrooks在《神話人月》中對(duì)軟件工程項(xiàng)目進(jìn)行了著名的描述。
我認(rèn)為討論其中一些其他領(lǐng)域以及它們?nèi)绾慰朔ㄐ殴ぞ咴黾拥膶?zhuān)業(yè)化和職責(zé)分離可能會(huì)有用。追溯其他領(lǐng)域的歷史是有啟發(fā)性的,因?yàn)樗梢詾槲覀冇懻摂?shù)據(jù)分析提供基礎(chǔ)。我與希拉里·帕克的播客的聽(tīng)眾知道,我們經(jīng)常有一個(gè)被稱(chēng)為“類(lèi)比角”的部分,這是統(tǒng)計(jì)的簡(jiǎn)單版本。
其他領(lǐng)域的專(zhuān)業(yè)化
第一個(gè)例子來(lái)自電影制作和劇本開(kāi)發(fā)。劇本實(shí)驗(yàn)室描述了劇本的歷史以及劇本開(kāi)發(fā)之前電影制作的工作方式:
在思考編劇的歷史時(shí),我們不能將劇本寫(xiě)作理論與電影制作的演變分開(kāi)。最早的電影通常是個(gè)人項(xiàng)目,從構(gòu)思到完成。這被稱(chēng)為“攝影師系統(tǒng)”,是最原始的電影制作。很快,導(dǎo)演就成為了整個(gè)過(guò)程的核心,但大多數(shù)電影都是在沒(méi)有明確導(dǎo)演想要拍攝什么的情況下制作的。當(dāng)導(dǎo)演計(jì)劃下一步拍攝什么時(shí),工作人員經(jīng)常等待。
這部電影是一個(gè)單人項(xiàng)目,或多或少是線性發(fā)展的。這是一個(gè)低效的系統(tǒng)——當(dāng)今大多數(shù)電影都是以高度非線性的方式制作的,以適應(yīng)演員的日程安排和各種制作流程。
如今,劇本是一個(gè)重要的交流中心,許多電影制作部門(mén)(服裝、化妝、發(fā)型、道具、布景)都可以圍繞它組織活動(dòng)。想象一下,如果每個(gè)部門(mén)的代表都必須就其工作的每個(gè)細(xì)節(jié)單獨(dú)咨詢(xún)編劇或?qū)а?。這將是一場(chǎng)日益復(fù)雜的噩夢(mèng)。有了一份書(shū)面文件,比如劇本,每個(gè)人都同意對(duì)“電影中發(fā)生的事情”具有權(quán)威性,人們就可以完成工作,而無(wú)需不斷的來(lái)回溝通。
DataFocus企業(yè)大數(shù)據(jù)BI分析系統(tǒng)讓數(shù)據(jù)分析就像搜索www.datafocus.ai/?from=zhihu第二個(gè)比喻來(lái)自金融。在金融領(lǐng)域,專(zhuān)業(yè)化的發(fā)展與有限責(zé)任類(lèi)似。這里的“專(zhuān)業(yè)化”是指公司所有者與管理者的分離。因此,公司管理者必須有辦法向投資者傳達(dá)公司運(yùn)營(yíng)的具體情況。因此,財(cái)務(wù)報(bào)表、會(huì)計(jì)規(guī)則和各種公開(kāi)文件的制定是為了讓投資者分析公司的健康狀況。格雷厄姆和多德的開(kāi)創(chuàng)性安全分析本質(zhì)上是呼吁投資者根據(jù)公開(kāi)數(shù)據(jù)評(píng)估公司,而不是根據(jù)關(guān)于什么是良好或安全投資的常見(jiàn)神話和傳說(shuō)。如今,隨著所有者和管理者的分離以及兩者之間標(biāo)準(zhǔn)化溝通格式(例如S-1、10-K、10-Q等)的創(chuàng)建,我們擁有了全球資本市場(chǎng)體系的基礎(chǔ)。
最后一個(gè)類(lèi)比來(lái)自西方古典音樂(lè),音樂(lè)的作曲家和演奏者之間經(jīng)常存在分歧。在更復(fù)雜的交響樂(lè)中,您可能會(huì)說(shuō)存在三個(gè)角色:作曲家、表演者和翻譯/指揮。然而,在早期古典音樂(lè)中,這種劃分并不存在,作曲家經(jīng)常自己演奏音樂(lè),而且常常是他們自己。在這種情況下,不需要寫(xiě)下來(lái),因?yàn)橐魳?lè)可以存儲(chǔ)在作曲家的頭腦中并演奏。這個(gè)概念在電影《阿馬德烏斯》中得到了很好的體現(xiàn),莫扎特將他的歌劇《魔笛》描述為“在我的意大利面條中”(其余的只是涂鴉和胡言亂語(yǔ))。
數(shù)據(jù)分析呢?
在當(dāng)今的數(shù)據(jù)科學(xué)中,或者實(shí)際上在科學(xué)中,大部分都遵循“垂直整合”模型,即同一個(gè)人提出問(wèn)題、收集數(shù)據(jù)并分析數(shù)據(jù)。直到需要將這項(xiàng)工作傳播給其他人(包括您自己)時(shí),才真正需要一種溝通方法。在大型合作中,分析溝通需要從一開(kāi)始就進(jìn)行,我的經(jīng)驗(yàn)是,即使在最好的情況下,該方法也是臨時(shí)的,很難在涉及不同人員的另一個(gè)項(xiàng)目中重現(xiàn)。
大多數(shù)人都會(huì)同意,實(shí)際執(zhí)行分析的軟件代碼是傳達(dá)正在執(zhí)行的操作的重要部分。然而,并不是每個(gè)人都需要或想要代碼提供的所有細(xì)節(jié)。也許我們可以從音樂(lè)中借鑒的一個(gè)概念是樂(lè)譜和聲部之間的區(qū)別。在交響樂(lè)中,指揮家需要完美的樂(lè)譜,因?yàn)樗麄冃枰烂總€(gè)人在做什么。但第一小提琴手只閱讀第一小提琴部分,他們不需要閱讀整個(gè)樂(lè)譜才能在創(chuàng)作成品中發(fā)揮重要作用。
為數(shù)據(jù)科學(xué)開(kāi)發(fā)適當(dāng)?shù)耐ㄐ殴ぞ邔?duì)于擴(kuò)展數(shù)據(jù)分析、讓更多人參與以及可重復(fù)性/再現(xiàn)性至關(guān)重要,以便更多人能夠了解分析中發(fā)生的情況。在那之前,我認(rèn)為我們將繼續(xù)將其他領(lǐng)域的工具插入數(shù)據(jù)科學(xué)過(guò)程,這很好。這些工具很有用,但我認(rèn)為最終并不完美。
DataFocus企業(yè)大數(shù)據(jù)BI分析系統(tǒng),讓數(shù)據(jù)分析像搜索www.datafocus.ai/?from=zhihu一樣簡(jiǎn)單
相關(guān)資訊
- 工學(xué)門(mén)類(lèi)及其特點(diǎn)分析(工學(xué)門(mén)類(lèi)及其特點(diǎn)論文)
- 河南中考物理分析研究(河南中考物理分析題)
- 積極運(yùn)動(dòng)有利于提高成績(jī)嗎(積極運(yùn)動(dòng)有助于提高生命質(zhì)量)
- 數(shù)學(xué)期中考試分析總結(jié)及改進(jìn)措施(數(shù)學(xué)期中考試分析及措施)
- 經(jīng)管類(lèi)考研推薦(經(jīng)管類(lèi)考研機(jī)構(gòu)實(shí)力排名)
- 教導(dǎo)主任期中考試成績(jī)分析總結(jié)與反思(教導(dǎo)主任期中考試總結(jié)發(fā)言)
- 鳳縣召開(kāi)教育扶貧專(zhuān)項(xiàng)排查問(wèn)題分析研判會(huì)議(鳳縣召開(kāi)教育扶貧專(zhuān)項(xiàng)排查問(wèn)題分析研判會(huì))
- 海南省資源平臺(tái)(海南省資源公共服務(wù)平臺(tái))