久久精品中文字幕免费_91香蕉国产亚洲一区二区三区_国产精品巨作无遮拦_亚洲人成电影

    <center id="oy65s"><ol id="oy65s"></ol></center>

  • <menu id="oy65s"></menu>
    當(dāng)前位置:首頁(yè) > 足球資訊 > 正文內(nèi)容

    教育大數(shù)據(jù)之?dāng)?shù)據(jù)集成系統(tǒng)

    杏彩體育2年前 (2023-01-30)足球資訊42

    數(shù)據(jù)集成指的是把分散在各個(gè)系統(tǒng)中的各種類(lèi)型的數(shù)據(jù)統(tǒng)一匯聚起來(lái),而數(shù)據(jù)集成系統(tǒng)就是提供數(shù)據(jù)集成能力的平臺(tái)。如何做好一個(gè)數(shù)據(jù)集成系統(tǒng)呢?本文作者對(duì)此進(jìn)行了分析,一起來(lái)看一下吧。

    一個(gè)風(fēng)雨交加的晚上,領(lǐng)導(dǎo)把我拉到會(huì)議室說(shuō):老影啊,公司接到一個(gè)項(xiàng)目,需要在3個(gè)月里完成一個(gè)大數(shù)據(jù)平臺(tái)的開(kāi)發(fā),用于項(xiàng)目的交付,這個(gè)任務(wù)交給你了,加油搞!此刻的我:搞?搞事情?。∮纱宋议_(kāi)始了數(shù)據(jù)平臺(tái)的“闖關(guān)之路”,遇到的第一個(gè)boss就是數(shù)據(jù)集成系統(tǒng)……

    01 什么是數(shù)據(jù)集成?

    百科里的解釋是:把不同來(lái)源、格式、特點(diǎn)性質(zhì)的數(shù)據(jù)在邏輯上或物理上有機(jī)地集中,從而為企業(yè)提供全面的數(shù)據(jù)共享;通俗講就是把分散在各個(gè)系統(tǒng)中的各種類(lèi)型的數(shù)據(jù)統(tǒng)一匯聚起來(lái),主要體現(xiàn)在一個(gè)“集”字。而數(shù)據(jù)集成系統(tǒng)就是提供數(shù)據(jù)集成能力的平臺(tái),是一站式解決異構(gòu)數(shù)據(jù)存儲(chǔ)互通,消除數(shù)據(jù)孤島的同步平臺(tái),為大數(shù)據(jù)各系統(tǒng)和業(yè)務(wù)方提供數(shù)據(jù)集成的高效通道 。

    拿現(xiàn)實(shí)中的實(shí)例類(lèi)比來(lái)說(shuō),數(shù)據(jù)集成就好比把各種糧食通過(guò)不同的管道灌輸?shù)揭粋€(gè)大糧倉(cāng)中,這些管道就是數(shù)據(jù)集成系統(tǒng),我們可以支持接入各式各樣的糧食,小麥、玉米、大豆等等,同時(shí)支持在這些管道中加一些濾網(wǎng),比如在大豆的管道中加上5mm的濾網(wǎng),此時(shí)從大豆管道過(guò)來(lái)的糧食只有5mm以下的大豆,這就相當(dāng)于數(shù)據(jù)集成系統(tǒng)中的數(shù)據(jù)過(guò)濾功能;這個(gè)糧倉(cāng)相當(dāng)于集成目的,我們把數(shù)據(jù)集成進(jìn)來(lái)之后存儲(chǔ)在這里,供其他各方消費(fèi)。

    02 教育為什么要做數(shù)據(jù)集成?

    1. 數(shù)據(jù)大爆炸

    現(xiàn)在是一個(gè)信息大爆炸時(shí)代,互聯(lián)網(wǎng)的高速發(fā)展、迅速普及,讓信息無(wú)處不在、無(wú)孔不入,每天在我們所生活在的這個(gè)世界出現(xiàn)了大量的信息,教育場(chǎng)景下也不例外,隨著各種信息化系統(tǒng)的涌入,信息以空前的速度增長(zhǎng),教育從業(yè)者體驗(yàn)著信息時(shí)代便捷的同時(shí),也給他們帶來(lái)了問(wèn)題和“副作用”,從浩如煙海的信息海洋中迅速而準(zhǔn)確地獲取他們最需要的信息,變得非常困難。

    2. 數(shù)據(jù)來(lái)源多樣化

    隨著《教育信息化2.0行動(dòng)計(jì)劃》的提出,教學(xué)過(guò)程中的信息化系統(tǒng)越來(lái)越多,比如作業(yè)系統(tǒng)、考試系統(tǒng)、選課系統(tǒng)、智慧課堂等等,每個(gè)系統(tǒng)都會(huì)產(chǎn)生大量的數(shù)據(jù),存儲(chǔ)在各自的數(shù)據(jù)庫(kù)中,如果系統(tǒng)的服務(wù)商不同,可能數(shù)據(jù)的格式也不一樣,致使教育場(chǎng)景下的數(shù)據(jù)越來(lái)越多,越來(lái)越難以管理。

    3. 數(shù)據(jù)集不同結(jié)構(gòu)

    教育場(chǎng)景下的數(shù)據(jù)集可能是結(jié)構(gòu)化的、半結(jié)構(gòu)化的,甚至非結(jié)構(gòu)化的;比如:考試系統(tǒng)中的數(shù)據(jù)是結(jié)構(gòu)化的,評(píng)價(jià)系統(tǒng)中的數(shù)據(jù)是半結(jié)構(gòu)化的,課堂實(shí)錄中的數(shù)據(jù)是非結(jié)構(gòu)化的;不同結(jié)構(gòu)的數(shù)據(jù)需要整合成統(tǒng)一的結(jié)構(gòu)才能夠進(jìn)行統(tǒng)計(jì)和分析。

    4. 數(shù)據(jù)冗余

    數(shù)據(jù)中有很多冗余、錯(cuò)誤、敏感數(shù)據(jù),如果不進(jìn)行數(shù)據(jù)清洗,會(huì)影響數(shù)據(jù)分析的效率和結(jié)果;在這種情況下需要我們配置統(tǒng)一的標(biāo)準(zhǔn),對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的處理,以便于后續(xù)進(jìn)行統(tǒng)計(jì)分析。

    03 數(shù)據(jù)集成系統(tǒng)對(duì)教育的價(jià)值是什么?

    大數(shù)據(jù)技術(shù)能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識(shí)挖掘出來(lái),按照科學(xué)的教育評(píng)價(jià)準(zhǔn)則,對(duì)教學(xué)數(shù)據(jù)進(jìn)行科學(xué)的統(tǒng)計(jì)分析,提供有價(jià)值的教學(xué)質(zhì)量測(cè)評(píng)與分析數(shù)據(jù),實(shí)現(xiàn)對(duì)教育活動(dòng),教育過(guò)程和教育結(jié)果的價(jià)值評(píng)判,為提高教育質(zhì)量,教育決策以及學(xué)校改進(jìn)日常教學(xué)方法提供科學(xué)的依據(jù),實(shí)現(xiàn)教育管理的智能化,提升教育管理與服務(wù)水平。

    數(shù)據(jù)集成系統(tǒng)作為底層基礎(chǔ)支撐性服務(wù),是大數(shù)據(jù)系統(tǒng)的核心組成部分。通過(guò)提供數(shù)據(jù)集成能力,將教育各部門(mén)和來(lái)自互聯(lián)網(wǎng)的結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行統(tǒng)一的匯聚接入,存儲(chǔ)到大數(shù)據(jù)存儲(chǔ)組件,并支持?jǐn)?shù)據(jù)的預(yù)處理,為大數(shù)據(jù)系統(tǒng)提供原始數(shù)據(jù)支撐。

    04 數(shù)據(jù)集成系統(tǒng)怎么做?

    1. 建設(shè)原則

    數(shù)據(jù)采集系統(tǒng)針對(duì)實(shí)際項(xiàng)目中復(fù)雜的、異構(gòu)的數(shù)據(jù)環(huán)境,實(shí)現(xiàn)對(duì)多種數(shù)據(jù)源的集成,支持的關(guān)系數(shù)據(jù)庫(kù)有Oracle、MySQL、Sqlserver等,支持的文件類(lèi)型有txt文件、csv文件、excel文件等,支持的接口類(lèi)型有webservice接口、http接口、socket接口等。

    對(duì)于不同的大數(shù)據(jù)存儲(chǔ)需求,實(shí)現(xiàn)對(duì)多種大數(shù)據(jù)存儲(chǔ)組件的支持,支持的大數(shù)據(jù)存儲(chǔ)組件包括HDFS、HBase、Hive、Solr、Elasticserach等。

    針對(duì)數(shù)據(jù)的預(yù)處理需求,實(shí)現(xiàn)對(duì)數(shù)據(jù)的清洗、轉(zhuǎn)換、標(biāo)準(zhǔn)化等預(yù)處理的支持,并且支持清洗規(guī)則、轉(zhuǎn)換規(guī)則的用戶(hù)自定義,以及清洗、轉(zhuǎn)換、導(dǎo)入流程的用戶(hù)自定義。

    在數(shù)據(jù)采集系統(tǒng)中,各類(lèi)功能點(diǎn)模塊化、組件化,便于步驟獨(dú)立,保證系統(tǒng)內(nèi)部模塊自治,同時(shí)便于多種步驟、方法的組合應(yīng)用。

    簡(jiǎn)化用戶(hù)操作,通過(guò)圖形化的配置方式,簡(jiǎn)單,靈活,使得用戶(hù)無(wú)需過(guò)分關(guān)心數(shù)據(jù)庫(kù)的各種內(nèi)部細(xì)節(jié),而專(zhuān)注于功能。

    2. 數(shù)據(jù)集成信息框架

    數(shù)據(jù)集成信息流

    3. 功能結(jié)構(gòu)

    為了快速實(shí)現(xiàn)數(shù)據(jù)集成系統(tǒng),滿足后續(xù)項(xiàng)目交付,經(jīng)過(guò)和研發(fā)大佬的多次溝通,優(yōu)先實(shí)現(xiàn)為業(yè)務(wù)提供數(shù)據(jù)集成的能力的數(shù)據(jù)源管理和集成任務(wù)管理。明確了第一版需求,只要包含數(shù)據(jù)源管理和集成任務(wù)管理就可以支持項(xiàng)目交付,因此功能結(jié)構(gòu)設(shè)計(jì)如下:

    數(shù)據(jù)集成系統(tǒng)功能結(jié)構(gòu)圖

    4. 建設(shè)內(nèi)容

    1)數(shù)據(jù)源管理

    數(shù)據(jù)源模塊主要管理平臺(tái)支持的數(shù)據(jù)組件的基礎(chǔ)信息,包含各種數(shù)據(jù)組件的新增,配置和管理,如關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)IP,端口,訪問(wèn)信息等。這里大家可以理解為一個(gè)中間層,先通過(guò)數(shù)據(jù)抽取組件將各系統(tǒng)數(shù)據(jù)抽取到這里,以備后續(xù)集成任務(wù)管理模塊的調(diào)用。

    在這里可以對(duì)數(shù)據(jù)源進(jìn)行增刪改查,前提是需要和數(shù)據(jù)來(lái)源方溝通好,需要提供數(shù)據(jù)庫(kù)IP相關(guān)信息,下方是頁(yè)面示例:

    數(shù)據(jù)源管理列表

    2)集成任務(wù)管理

    當(dāng)用戶(hù)創(chuàng)建好數(shù)據(jù)源之后,需要有一個(gè)模塊支持用戶(hù)創(chuàng)建集成任務(wù),相當(dāng)于上文中講到的,上游的所有糧食都準(zhǔn)備好了,需要我們提供搭建管道的地方,讓用戶(hù)把所有的管道搭起來(lái),然后把各種糧食都匯聚到一起。此時(shí)集成任務(wù)管理模塊誕生了,這個(gè)模塊下主要對(duì)數(shù)據(jù)集成的任務(wù)進(jìn)行統(tǒng)一的管理,支持用戶(hù)對(duì)數(shù)據(jù)集成任務(wù)進(jìn)行增刪改查。

    ①操作列表功能

    上線:集成任務(wù)完成創(chuàng)建狀態(tài)默認(rèn)為未上線,此時(shí)用戶(hù)可將集成任務(wù)上線,上線為就緒狀態(tài);運(yùn)行:上線狀態(tài)下的任務(wù)支持運(yùn)行,運(yùn)行自動(dòng)調(diào)用任務(wù)執(zhí)行組件,開(kāi)始數(shù)據(jù)集成;下線:已上線的任務(wù)支持下線;刪除:未上線和已下線的任務(wù)支持刪除;編輯:未上線和已下線的任務(wù)支持編輯。

    數(shù)據(jù)集成任務(wù)列表

    ②任務(wù)運(yùn)行

    集成任務(wù)創(chuàng)建好之后,如果需要周期性的拉取數(shù)據(jù),這時(shí)候需要支持進(jìn)行例行周期配置,支持用戶(hù)配置定時(shí)任務(wù);同時(shí)支持用戶(hù)進(jìn)行失敗策略、任務(wù)執(zhí)行優(yōu)先級(jí)等相關(guān)參數(shù)的配置。

    3)新增集成任務(wù)

    為了方便用戶(hù)填寫(xiě),支持用戶(hù)選擇不同的數(shù)據(jù)源類(lèi)型,數(shù)據(jù)接口類(lèi)型不同,需要配置的參數(shù)信息也不同;但是總體來(lái)說(shuō)數(shù)據(jù)集成主要分為三步:

    數(shù)據(jù)接入:回答數(shù)據(jù)從哪來(lái)的問(wèn)題;數(shù)據(jù)處理:回答對(duì)數(shù)據(jù)要做什么的問(wèn)題;數(shù)據(jù)輸出:回答數(shù)據(jù)要到哪去的問(wèn)題。

    下方以將第三方數(shù)據(jù)庫(kù)數(shù)據(jù)集成到hive中為例舉例說(shuō)明。選擇數(shù)據(jù)庫(kù)之后,頁(yè)面進(jìn)入數(shù)據(jù)集成任務(wù)配置頁(yè),三個(gè)步驟依次如下:

    ①數(shù)據(jù)接入

    主要配置數(shù)據(jù)源相關(guān)信息,需要用戶(hù)填寫(xiě)數(shù)據(jù)源表相關(guān)信息:

    數(shù)據(jù)源:數(shù)據(jù)集群相關(guān)信息;數(shù)據(jù)庫(kù):源數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫(kù);是否分表:如果分表存儲(chǔ)需要從多個(gè)表抽取數(shù)據(jù);表名:源數(shù)據(jù)所在表名;數(shù)據(jù)歸屬產(chǎn)品/系統(tǒng):這部分?jǐn)?shù)據(jù)在目錄管理系統(tǒng)維護(hù),這里直接引用;數(shù)據(jù)預(yù)覽:支持用戶(hù)對(duì)所選表進(jìn)行預(yù)覽,查看數(shù)據(jù)格式。

    數(shù)據(jù)接入

    ②數(shù)據(jù)處理

    到在數(shù)據(jù)集成過(guò)程中會(huì)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,考慮到后續(xù)的擴(kuò)展性,這里直接將各種處理步驟提煉為公共組件,支持用戶(hù)自定義選擇,第一期可支持:字段映射過(guò)濾、賬號(hào)匹配、數(shù)據(jù)脫敏、數(shù)據(jù)轉(zhuǎn)換;為了節(jié)省操作,數(shù)據(jù)處理默認(rèn)以字段映射過(guò)濾開(kāi)始,自動(dòng)選擇一項(xiàng),用戶(hù)可直接點(diǎn)擊下一步。

    數(shù)據(jù)處理

    ③數(shù)據(jù)輸出

    此時(shí)的數(shù)據(jù)經(jīng)過(guò)預(yù)處理,已經(jīng)完成了清洗、轉(zhuǎn)換的操作,接下來(lái)就需要將處理完的數(shù)據(jù)存下來(lái),以備后續(xù)使用。

    數(shù)據(jù)輸出

    05 數(shù)據(jù)集成結(jié)束后做什么?

    下面以學(xué)生畫(huà)像的思路和大家簡(jiǎn)單聊聊。通過(guò)從各個(gè)系統(tǒng)中采集過(guò)來(lái)的數(shù)據(jù),包含但不限于:學(xué)生上網(wǎng)數(shù)據(jù)、網(wǎng)頁(yè)瀏覽時(shí)長(zhǎng)、作業(yè)完成數(shù)據(jù)、作業(yè)完成時(shí)長(zhǎng)、課堂互動(dòng)數(shù)據(jù)等等,幫助學(xué)校管理者針對(duì)學(xué)生群體進(jìn)行標(biāo)簽化分析。幫助教育管理者從學(xué)習(xí),網(wǎng)絡(luò)行為,生活等多維度分析學(xué)生群體的習(xí)慣和特點(diǎn),為學(xué)校實(shí)現(xiàn)個(gè)性化培養(yǎng)教育提供數(shù)據(jù)支撐。

    學(xué)生畫(huà)像整體分為個(gè)人畫(huà)像和群體畫(huà)像:

    1)群體畫(huà)像

    通過(guò)對(duì)學(xué)生行為數(shù)據(jù)和結(jié)果數(shù)據(jù)的分析,為每個(gè)學(xué)生貼上具有行為或思想的特征標(biāo)簽,并按照群體分類(lèi),教育管理者可以查看每個(gè)分類(lèi)的人群特征,并從學(xué)校、年級(jí)、男女比例等各方面進(jìn)行群體標(biāo)簽的分析,幫助學(xué)校定位不同標(biāo)簽人群的特征和規(guī)律,實(shí)現(xiàn)精細(xì)化管理,同時(shí)通過(guò)對(duì)不同行為數(shù)據(jù)進(jìn)行閾值設(shè)置,及時(shí)發(fā)現(xiàn)出現(xiàn)問(wèn)題的學(xué)生,以便進(jìn)行及時(shí)糾偏。

    2)個(gè)人畫(huà)像

    通過(guò)采集學(xué)生各場(chǎng)景數(shù)據(jù),如學(xué)習(xí)行為、學(xué)習(xí)結(jié)果、消費(fèi)信息、飲食信息、運(yùn)動(dòng)信息等,綜合分析學(xué)生的學(xué)習(xí)狀態(tài),全面刻畫(huà)學(xué)生畫(huà)像,幫助教育管理者全方位了解一個(gè)學(xué)生,通過(guò)多維度分析學(xué)生的學(xué)習(xí)習(xí)慣和學(xué)習(xí)動(dòng)機(jī),逐步實(shí)現(xiàn)喊了2000多年的口號(hào)“因材施教”。

    作者:一丁,“數(shù)據(jù)人創(chuàng)作者聯(lián)盟”成員。

    本文由@一個(gè)數(shù)據(jù)人的自留地 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

    題圖來(lái)自Unsplash,基于CC0協(xié)議。

    該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

    掃描二維碼推送至手機(jī)訪問(wèn)。

    版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請(qǐng)聯(lián)系。

    本文鏈接:http://www.daniuzhishi.com/?id=46168

    “教育大數(shù)據(jù)之?dāng)?shù)據(jù)集成系統(tǒng)” 的相關(guān)文章

    2020款哈弗7動(dòng)感設(shè)計(jì)理念,足球比分內(nèi)部空間極為寬敞

    2020款哈弗7動(dòng)感設(shè)計(jì)理念,足球比分內(nèi)部空間極為寬敞

    提到哈弗汽車(chē)相信大家都不陌生吧,作為長(zhǎng)城旗下的獨(dú)立品牌,哈弗在汽車(chē)界里有很高名氣,旗下產(chǎn)品眾多,并且銷(xiāo)量口碑都很不錯(cuò),最受關(guān)注的莫過(guò)于哈弗H6了,憑著極高實(shí)力和性?xún)r(jià)比,以連續(xù)多年獲得“銷(xiāo)量王”稱(chēng)號(hào),被人們視為“國(guó)...

    中國(guó)足球彩票22145期勝負(fù)游戲14場(chǎng)交戰(zhàn)記錄

      卡塔爾 VS 塞內(nèi)加爾兩隊(duì)近10年沒(méi)有交戰(zhàn)記錄。   荷蘭 VS 厄瓜多爾兩隊(duì)近10年的交戰(zhàn)次數(shù)為1場(chǎng),荷蘭0勝1平0負(fù),贏球概率為0%,平局概率為100%,輸球概率為0%。 賽事 日期 主隊(duì) 比分 客隊(duì) 賽果...

    中國(guó)的足球隊(duì)奪得世界冠軍!

    中國(guó)的足球隊(duì)奪得世界冠軍!

    「最終,比賽結(jié)束的哨聲響起,各位觀眾,來(lái)自中國(guó)的WeKick足球團(tuán)隊(duì),獲得了本次挑戰(zhàn)賽的冠軍,讓我們恭喜他們?!?恩等一下,中國(guó)足球隊(duì)?奪冠?你沒(méi)看錯(cuò),在AI世界里,來(lái)自中國(guó)的足球團(tuán)隊(duì)WeKick,這次沖出了亞洲,在世界的舞臺(tái)上,大放異彩。 他們獲得冠軍的這次賽事由Goog...

    2-0!2-1!1-0!世界杯瘋狂一夜:首支出線隊(duì)誕生,梅西絕境救主

    2-0!2-1!1-0!世界杯瘋狂一夜:首支出線隊(duì)誕生,梅西絕境救主

    北京時(shí)間11月27日,世界杯小組賽第二輪第二個(gè)比賽日,讓我們一起看看發(fā)生了什么。 法國(guó)2-1丹麥 姆巴佩梅開(kāi)二度+絕殺,法國(guó)2-1戰(zhàn)勝丹麥,取得開(kāi)局2連勝,成為本屆世界杯首支出線球隊(duì)。法國(guó)隊(duì)在今年的兩回合歐國(guó)聯(lián)比賽中被丹麥雙殺,苦等2個(gè)月后他們...

    世界杯競(jìng)彩足球玩法大全,小白到老司機(jī)的晉級(jí)之路,建議收藏

    世界杯競(jìng)彩足球玩法大全,小白到老司機(jī)的晉級(jí)之路,建議收藏

    世界杯還有不到一個(gè)月就來(lái)了,這期間全世界的熱點(diǎn)都將聚焦在這個(gè)星球上最大的體育賽事上。俗話說(shuō)搏一搏單車(chē)變摩托,這個(gè)時(shí)候無(wú)論是資深球迷還是小白偽球迷都會(huì)玩上兩把競(jìng)彩,畢竟足球配啤酒再加上競(jìng)彩才是這個(gè)夏季盛宴的標(biāo)配。 而球天下為大家匯總了一篇關(guān)于中國(guó)競(jìng)彩足球...

    今日足球競(jìng)彩推薦 足球賽事分析 比分預(yù)測(cè)參考,切爾西VS沃特福德

    今日足球競(jìng)彩推薦 足球賽事分析 比分預(yù)測(cè)參考,切爾西VS沃特福德

    周日003英超:切爾西VS沃特福德 切爾西目前球隊(duì)在英超37輪賽事取得20勝11平6負(fù),目前以總積分71分排在本賽事積分榜第3,球隊(duì)目前在本賽事共踢進(jìn)了74球,場(chǎng)均進(jìn)球數(shù)為2.0球,進(jìn)攻能力火力全開(kāi),共丟掉了32球,場(chǎng)均丟球數(shù)為0.9球,防守強(qiáng)度仍需提升。上輪英超賽事主場(chǎng)迎戰(zhàn)萊斯特...

    ?