摘要:信息技術(shù)的普及使制造業(yè)中積累了大量與生產(chǎn)、管理和運(yùn)營(yíng)相關(guān)的數(shù)據(jù),這些數(shù)據(jù)中隱藏著諸多有價(jià)值的知識(shí),可以指導(dǎo)企業(yè)優(yōu)化管理流程、改進(jìn)生產(chǎn)工藝、調(diào)整加工參數(shù)、診斷設(shè)備故障等,幫助制造業(yè)企業(yè)提高效率、降低成本,達(dá)到利潤(rùn)最大化,并為實(shí)現(xiàn)智能制造打下基礎(chǔ)。然而,當(dāng)前制造業(yè)中存在著數(shù)據(jù)量大、數(shù)據(jù)利用率低的矛盾,許多場(chǎng)景中的數(shù)據(jù)規(guī)模甚至已經(jīng)超出傳統(tǒng)數(shù)據(jù)分析方法所能承受的極限。因此,越來(lái)越多的研究者致力于研究大數(shù)據(jù)分析在制造業(yè)中的應(yīng)用,旨在通過(guò)大數(shù)據(jù)分析技術(shù)發(fā)掘蘊(yùn)含在數(shù)據(jù)中的寶貴知識(shí)和財(cái)富。介紹了制造業(yè)大數(shù)據(jù)的概念和特征,討論了制造業(yè)大數(shù)據(jù)及其分析的特點(diǎn)和挑戰(zhàn),并從制造業(yè)產(chǎn)業(yè)鏈流程的角度出發(fā),將制造業(yè)概括為設(shè)計(jì)、生產(chǎn)、采購(gòu)、銷售和售后五個(gè)階段,分別闡釋了每個(gè)階段的典型業(yè)務(wù)場(chǎng)景及需求,總結(jié)了大數(shù)據(jù)分析模型在這些業(yè)務(wù)場(chǎng)景中的應(yīng)用方面的研究進(jìn)展。最后,對(duì)大數(shù)據(jù)分析在制造業(yè)中的應(yīng)用現(xiàn)狀做出了分析和評(píng)價(jià),并討論了其中存在的問(wèn)題和不足。
關(guān)鍵詞:大數(shù)據(jù);制造業(yè);數(shù)據(jù)挖掘;工業(yè)流程;智能制造
制造業(yè)大數(shù)據(jù)是指在制造業(yè)領(lǐng)域中所產(chǎn)生的大數(shù)據(jù)。伴隨著工業(yè)自動(dòng)化和信息化發(fā)展,信息技術(shù)滲透到了制造業(yè)產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié),條形碼、二維碼、RFID、工業(yè)傳感器、自動(dòng)控制系統(tǒng)、ERP、CAX等技術(shù)在制造業(yè)中得到了廣泛的應(yīng)用。互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新一代信息技術(shù)與制造業(yè)的融合,使制造業(yè)各個(gè)環(huán)節(jié)產(chǎn)生的數(shù)據(jù)都可以被快速收集、存儲(chǔ)到信息系統(tǒng)中。隨著企業(yè)規(guī)模的擴(kuò)大以及時(shí)間的積累,這些數(shù)據(jù)以空前的速度增長(zhǎng),使制造業(yè)進(jìn)入“大數(shù)據(jù)時(shí)代”。例如,長(zhǎng)虹集團(tuán)有限公司等離子顯示板制造中,生產(chǎn)流程數(shù)據(jù)超過(guò)10000個(gè)參數(shù),每天產(chǎn)生3000萬(wàn)條記錄,約10GB;GE能源監(jiān)測(cè)和診斷中心每天從客戶收集10G字節(jié)的數(shù)據(jù)。在這些不斷產(chǎn)生和積累的海量數(shù)據(jù)中蘊(yùn)含著大量有價(jià)值的潛在信息。運(yùn)用統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等大數(shù)據(jù)分析方法對(duì)制造業(yè)產(chǎn)生的數(shù)據(jù)進(jìn)行分析,發(fā)掘其中蘊(yùn)含的知識(shí)和規(guī)則,并基于這些知識(shí)和規(guī)則指導(dǎo)制造業(yè)的研發(fā)設(shè)計(jì)、生產(chǎn)制造、銷售售后、經(jīng)營(yíng)管理等過(guò)程,有助于改進(jìn)生產(chǎn)方式、優(yōu)化管理流程、感知客戶需求、提升品牌價(jià)值,達(dá)到節(jié)約成本、提高效率、降低能耗的目的,使制造業(yè)逐步走向智能化。
制造業(yè)大數(shù)據(jù)除了具有大數(shù)據(jù)共有的“5V”(即Volume、Velocity、Varity、Value和Veracity)特性,還具有諸多與制造業(yè)產(chǎn)業(yè)特性相關(guān)的特征,概括如下:
(1)數(shù)據(jù)來(lái)源多樣。由于制造業(yè)門類眾多,企業(yè)的大數(shù)據(jù)來(lái)自產(chǎn)品設(shè)計(jì)軟件、生產(chǎn)裝備運(yùn)行過(guò)程、產(chǎn)品質(zhì)量監(jiān)測(cè)設(shè)備、企業(yè)管理信息系統(tǒng)、供應(yīng)鏈與銷售網(wǎng)絡(luò)等多種數(shù)據(jù)源。另一方面,由于制造業(yè)企業(yè)自動(dòng)化程度不一致,大量中小企業(yè)未達(dá)到全自動(dòng)化水平,存在人機(jī)協(xié)同工作,因此制造業(yè)中的大數(shù)據(jù)既有機(jī)器產(chǎn)生的數(shù)據(jù)(如實(shí)時(shí)感知數(shù)據(jù)),也有人工輸入的數(shù)據(jù)(如企業(yè)管理數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù))。大量自治數(shù)據(jù)源中存在數(shù)據(jù)不一致和沖突,加之制造過(guò)程復(fù)雜、數(shù)據(jù)量大、更新速度快,因而制造業(yè)中的數(shù)據(jù)產(chǎn)生錯(cuò)誤的概率更大。
?。?)數(shù)據(jù)質(zhì)量低。由于制造業(yè)流程中各工序環(huán)境復(fù)雜,收集數(shù)據(jù)的傳感器或傳遞信息的無(wú)線網(wǎng)絡(luò)都有可能出錯(cuò)而導(dǎo)致收集到的數(shù)據(jù)中存在較一般大數(shù)據(jù)中更多的噪音或缺失。
?。?)數(shù)據(jù)蘊(yùn)含信息復(fù)雜,耦合性不確定。由于制造業(yè)企業(yè)信息化水平參差不齊,以及不同行業(yè)生產(chǎn)過(guò)程的特性差異,生產(chǎn)環(huán)節(jié)各步驟之間可能存在不同程度的耦合,因此制造業(yè)中數(shù)據(jù)之間的關(guān)聯(lián)和相互影響較為普遍。
?。?)數(shù)據(jù)實(shí)時(shí)性高。生產(chǎn)線監(jiān)測(cè)數(shù)據(jù)(如設(shè)備運(yùn)行狀態(tài)監(jiān)測(cè)數(shù)據(jù)和各工序生產(chǎn)狀況監(jiān)測(cè)數(shù)據(jù))等是連續(xù)采樣的時(shí)間序列數(shù)據(jù),具有時(shí)間標(biāo)簽和嚴(yán)格的先后次序。而工業(yè)系統(tǒng)是典型的實(shí)時(shí)控制和實(shí)時(shí)信息處理系統(tǒng),生產(chǎn)線上的諸多環(huán)節(jié)具有嚴(yán)栺的實(shí)時(shí)性約束,這決定了制造業(yè)中較大比例的數(shù)據(jù)是實(shí)時(shí)數(shù)據(jù)。
制造業(yè)大數(shù)據(jù)的特點(diǎn)決定了其分析任務(wù)具有如下特點(diǎn):
?。?)分析模型復(fù)雜多樣。制造業(yè)大數(shù)據(jù)分析注重特征背后的物理含義以及特征之間關(guān)聯(lián)性的機(jī)理,從而有效發(fā)現(xiàn)數(shù)據(jù)背后的意義。在制造業(yè)的不同領(lǐng)域,生產(chǎn)制造過(guò)程中原材料、工藝流程、產(chǎn)品形態(tài)不同,相應(yīng)的數(shù)據(jù)類型、格式、規(guī)模上均存在差異,這導(dǎo)致不同的內(nèi)涵和應(yīng)用價(jià)值,因而制造業(yè)大數(shù)據(jù)的分析與具體領(lǐng)域密切相關(guān),相應(yīng)的分析模型也復(fù)雜多樣。
?。?)數(shù)據(jù)質(zhì)量要求高。數(shù)據(jù)的質(zhì)量,會(huì)直接影響到分析結(jié)果的質(zhì)量。而制造業(yè)對(duì)大數(shù)據(jù)分析結(jié)果的容錯(cuò)能力較低。在工業(yè)環(huán)境中,一次失誤可能造成嚴(yán)重后果。因此,必須保證制造業(yè)大數(shù)據(jù)的質(zhì)量。
(3)分析實(shí)時(shí)性要求高。制造業(yè)大數(shù)據(jù)的一些場(chǎng)景,如電子芯片自動(dòng)化生產(chǎn)線的實(shí)時(shí)監(jiān)控和故障預(yù)警等,對(duì)數(shù)據(jù)處理的實(shí)時(shí)性要求很高,這些場(chǎng)景需要監(jiān)控?cái)?shù)據(jù)的獲取及處理時(shí)間在秒級(jí)甚至毫秒級(jí)。
綜上所述,目前大數(shù)據(jù)分析在制造業(yè)中的應(yīng)用面臨著如下挑戰(zhàn):
(1)如何提高數(shù)據(jù)質(zhì)量;
?。?)如何根據(jù)具體領(lǐng)域和應(yīng)用場(chǎng)景設(shè)計(jì)合適的分析模型;
?。?)如何設(shè)計(jì)滿足實(shí)時(shí)性要求的行之有效的分析算法;
(4)如何用大數(shù)據(jù)分析結(jié)果指導(dǎo)企業(yè)優(yōu)化管理和生產(chǎn)。
本文主要關(guān)注上述挑戰(zhàn)(2)和(3),即制造業(yè)具體領(lǐng)域和業(yè)務(wù)場(chǎng)景下的大數(shù)據(jù)分析模型和算法的應(yīng)用方面的研究進(jìn)展。制造業(yè)涉及行業(yè)眾多,實(shí)際工作場(chǎng)景千差萬(wàn)別,但廣義上講,所有產(chǎn)品的制造流程都可劃分為設(shè)計(jì)、生產(chǎn)、采購(gòu)、銷售和售后五個(gè)階段。因此,本文從上述五個(gè)階段出發(fā),分別闡述每個(gè)階段的主要任務(wù)場(chǎng)景和需要,以及大數(shù)據(jù)分析模型在各個(gè)場(chǎng)景中的應(yīng)用方面的研究情況。
1 設(shè)計(jì)階段
制造業(yè)流程中的設(shè)計(jì)階段在廣義上不僅包括產(chǎn)品本身的功能和外觀設(shè)計(jì),還包括加工產(chǎn)品所需的工藝流程設(shè)計(jì)等。目前,大數(shù)據(jù)分析在設(shè)計(jì)階段的應(yīng)用主要體現(xiàn)在工藝流程的參數(shù)優(yōu)化上。此外,在能效優(yōu)化、成本優(yōu)化、工藝標(biāo)準(zhǔn)優(yōu)化及智能設(shè)計(jì)等方面,大數(shù)據(jù)分析也能起到作用。
1.1 參數(shù)優(yōu)化
在冶金、化工、醫(yī)藥、食品加工等涉及復(fù)雜物理化學(xué)變化的工藝過(guò)程中,產(chǎn)品的質(zhì)量和產(chǎn)率通常由多個(gè)參數(shù)確定,且各個(gè)參數(shù)彼此存在耦合關(guān)系,確定使產(chǎn)品質(zhì)量、產(chǎn)率和能耗最優(yōu)化的輸入?yún)?shù)較為困難。傳統(tǒng)上,各個(gè)參數(shù)的設(shè)置一般都是依據(jù)經(jīng)驗(yàn),或是經(jīng)過(guò)大量的實(shí)驗(yàn)得來(lái),不僅費(fèi)時(shí)費(fèi)力,且難以找到優(yōu)化參數(shù)。而大數(shù)據(jù)分析方法,如關(guān)聯(lián)規(guī)則分析、回歸分析、決策樹(shù)、聚類、神經(jīng)網(wǎng)絡(luò)等,可以從大量數(shù)據(jù)中提取出復(fù)雜過(guò)程隱含的規(guī)則。采用這些方法,建立模型對(duì)歷史生產(chǎn)數(shù)據(jù)進(jìn)行分析,可以幫助找到最優(yōu)化的生產(chǎn)參數(shù),對(duì)生產(chǎn)參數(shù)的設(shè)計(jì)具有重要的參考價(jià)值。
文獻(xiàn)中采用關(guān)聯(lián)規(guī)則分析并找出了制造過(guò)程中化學(xué)成分(如碳、錳、磷、硫)含量、出鋼溫度和軋制速度對(duì)最后產(chǎn)品的機(jī)械性能的影響;文獻(xiàn)運(yùn)用聚類分析算法對(duì)煉鋼廠脫硫數(shù)據(jù)進(jìn)行分析,得到不同鐵水條件下的脫硫劑消耗情況,以此找到不同鐵水條件下脫硫效果最好的脫硫劑。文獻(xiàn)運(yùn)用前饋神經(jīng)網(wǎng)絡(luò)和分類決策樹(shù)對(duì)玻璃鍍膜工藝進(jìn)行建模,訓(xùn)練好的模型可以根據(jù)給定參數(shù)預(yù)測(cè)產(chǎn)品質(zhì)量,從而幫助企業(yè)快速確定符合預(yù)期質(zhì)量產(chǎn)品的工藝參數(shù)。文獻(xiàn)提出用動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型,從數(shù)據(jù)中提取發(fā)動(dòng)機(jī)缸蓋機(jī)加工參數(shù)、模具狀態(tài)和成品缸蓋燃燒室容積間的關(guān)系,指導(dǎo)機(jī)加工參數(shù)的選取,以控制燃燒室容積的制造誤差。文獻(xiàn)對(duì)批退火工序進(jìn)行建模,用同一訓(xùn)練數(shù)據(jù)對(duì)線性回歸、回歸分類樹(shù)、前饋反向傳播神經(jīng)網(wǎng)絡(luò)三種模型分別進(jìn)行訓(xùn)練,驗(yàn)證可知無(wú)需相關(guān)冶金和機(jī)械方面知識(shí)的前饋反向傳播神經(jīng)網(wǎng)絡(luò)反而得出了最為精準(zhǔn)的退火工序模型,該模型可根據(jù)當(dāng)前數(shù)據(jù)預(yù)測(cè)退火工序的運(yùn)行情況,專家也可針對(duì)該模型找到各參數(shù)的最優(yōu)值,進(jìn)而改善退火工序。文獻(xiàn)采用前饋人工神經(jīng)網(wǎng)絡(luò)對(duì)樹(shù)脂中間體生產(chǎn)流程和印刷電路板制造流程中各因素間非線性的因果關(guān)系進(jìn)行建模,模型使相關(guān)工作人員更好地認(rèn)識(shí)了流程的運(yùn)行情況,將明確的因果關(guān)系進(jìn)行量化,進(jìn)而可以運(yùn)用這些關(guān)系優(yōu)化制造工藝,提升產(chǎn)品質(zhì)量。
1.2 能耗優(yōu)化
在能耗巨大的工業(yè),如冶金工業(yè)中,節(jié)能減耗可以在很大程度上提高企業(yè)的經(jīng)濟(jì)效益,具有重大的現(xiàn)實(shí)意義。
文獻(xiàn)利用關(guān)聯(lián)規(guī)則、K聚類和改進(jìn)的門限法聚類等方法,從大量的煉鋼歷史能耗數(shù)據(jù)中獲取隱含的規(guī)則,指導(dǎo)企業(yè)改進(jìn)生產(chǎn)參數(shù),降低生產(chǎn)能耗。文獻(xiàn)提出了一種基于車間歷史數(shù)據(jù)的數(shù)控加工工藝參數(shù)自適應(yīng)能效優(yōu)化方法,用多元統(tǒng)計(jì)技術(shù)和聚類分析方法對(duì)車間歷史數(shù)據(jù)進(jìn)行分析,得到了工藝參數(shù)與能耗間的影響規(guī)律,再用模糊關(guān)聯(lián)規(guī)則算法得到高能效工藝參數(shù)優(yōu)化規(guī)則。
1.3 成本優(yōu)化
成本分析是設(shè)計(jì)階段的一項(xiàng)重要內(nèi)容,在鋼鐵企業(yè)的成本分析中,對(duì)其工藝路線中各工序的成本消耗進(jìn)行分析和控制是企業(yè)成本控制的首要任務(wù)。文獻(xiàn)基于抽樣的C4.5決策樹(shù)算法從工藝路線中選出對(duì)制造成本影響最大的工序,通過(guò)對(duì)選出的工序進(jìn)行控制和改進(jìn)來(lái)優(yōu)化整個(gè)工藝路線的成本。
1.4 工藝標(biāo)準(zhǔn)優(yōu)化
在工藝標(biāo)準(zhǔn)優(yōu)化方面,有文獻(xiàn)嘗試用數(shù)據(jù)挖掘的方法優(yōu)化服裝企業(yè)標(biāo)準(zhǔn)工時(shí)制定方案,以此提高企業(yè)成本核算和生產(chǎn)加工能力。文獻(xiàn)對(duì)服裝企業(yè)標(biāo)準(zhǔn)工時(shí)系統(tǒng)的數(shù)據(jù)用決策樹(shù)方法進(jìn)行分類,再用關(guān)聯(lián)規(guī)則對(duì)每一類數(shù)據(jù)進(jìn)行分析,得到款式、材料、年齡對(duì)實(shí)際工時(shí)與標(biāo)準(zhǔn)工時(shí)差異的影響程度,并以此為依據(jù)對(duì)原有標(biāo)準(zhǔn)工時(shí)進(jìn)行優(yōu)化。類似地,文獻(xiàn)基于神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)生產(chǎn)工時(shí),找出影響因素并排序,再用關(guān)聯(lián)規(guī)則模型評(píng)估導(dǎo)致標(biāo)準(zhǔn)工時(shí)不合理的影響因素并進(jìn)行修正。此外,文獻(xiàn)運(yùn)用關(guān)聯(lián)規(guī)則中的Apriori算法對(duì)模具企業(yè)CAPP改模知識(shí)庫(kù)進(jìn)行挖掘,較好的解決了模具企業(yè)改模工藝知識(shí)的獲取和積累問(wèn)題。該方法進(jìn)行工藝設(shè)計(jì)可提高CAPP智能化程度,提高改模工藝?yán)^承性與重用性、促進(jìn)改模工藝標(biāo)準(zhǔn)化。
1.5 智能設(shè)計(jì)
在智能設(shè)計(jì)方面,文獻(xiàn)用ART1神經(jīng)網(wǎng)絡(luò)對(duì)摩托車總體設(shè)計(jì)方案實(shí)例庫(kù)進(jìn)行聚類,再用BP神經(jīng)網(wǎng)絡(luò)記憶聚類結(jié)果并根據(jù)設(shè)計(jì)要求檢索設(shè)計(jì)方案,提高了摩托車總體方案設(shè)計(jì)的效率。文獻(xiàn)運(yùn)用模糊物元的方法將客戶的多維度需求問(wèn)題進(jìn)行優(yōu)化,對(duì)基本粒子群算法稍作變化,提出了混合式算法,并將其運(yùn)用在某型號(hào)轎車的整體外觀造型設(shè)計(jì)的客戶需求知識(shí)挖掘中。
2 生產(chǎn)階段
隨著自動(dòng)化生產(chǎn)線的廣泛應(yīng)用,生產(chǎn)過(guò)程產(chǎn)生的數(shù)據(jù)都可以被采集和存儲(chǔ)。對(duì)這些數(shù)據(jù)進(jìn)行分析,可以幫助人們對(duì)生產(chǎn)過(guò)程進(jìn)行監(jiān)控,以優(yōu)化生產(chǎn)過(guò)程、檢測(cè)和診斷故障,達(dá)到提高效率和產(chǎn)率、降低成本和能耗的目的。
2.1 質(zhì)量監(jiān)控
實(shí)際生產(chǎn)過(guò)程是一個(gè)動(dòng)態(tài)過(guò)程,生產(chǎn)線上工藝、設(shè)備和環(huán)境都極其復(fù)雜,許多未知因素往往都會(huì)影響最終產(chǎn)品的質(zhì)量。為了達(dá)到生產(chǎn)任務(wù)的要求,常常需要對(duì)產(chǎn)品質(zhì)量進(jìn)行快速檢測(cè)和提前預(yù)測(cè),以便及時(shí)做出調(diào)整。然而,由于生產(chǎn)線的復(fù)雜性,檢測(cè)或預(yù)測(cè)產(chǎn)品質(zhì)量并不容易。許多現(xiàn)有方法,或是準(zhǔn)確率較低,或是成本高昂。而諸如回歸、分類、聚類、決策樹(shù)、粗糙集、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法,由于能夠從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)則,因此能夠在一定程度上提高產(chǎn)品質(zhì)量的檢測(cè)或預(yù)測(cè)準(zhǔn)確率,且實(shí)施成本較低。
伸縮探針被用于檢測(cè)半導(dǎo)體產(chǎn)品的質(zhì)量。但由于伸縮探針本身存在使用壽命,若探針老化,則會(huì)影響產(chǎn)品檢測(cè)結(jié)果,帶來(lái)經(jīng)濟(jì)損失。文獻(xiàn)基于線性回歸和分類模型對(duì)伸縮探針的狀態(tài)進(jìn)行建模,從而掌握探針的老化程度,減少由于探針自身壽命問(wèn)題帶來(lái)的產(chǎn)品質(zhì)量檢測(cè)錯(cuò)誤,提高準(zhǔn)確率。
傳統(tǒng)的冶軋產(chǎn)品缺陷檢測(cè)方法,檢測(cè)標(biāo)準(zhǔn)不一,且存在大量漏洞和誤判。文獻(xiàn)使用實(shí)際的生產(chǎn)數(shù)據(jù)訓(xùn)練二分決策樹(shù)和多分決策樹(shù),得到了找到產(chǎn)品缺陷的眾多規(guī)則,使企業(yè)可以根據(jù)所得規(guī)則快速準(zhǔn)確的檢測(cè)生產(chǎn)出的冶軋產(chǎn)品的缺陷,提高了檢測(cè)的準(zhǔn)確率。
文獻(xiàn)針對(duì)印刷電路板中焊錫球缺陷這一質(zhì)量問(wèn)題,采用能夠識(shí)別個(gè)體區(qū)別的粗糙集對(duì)其進(jìn)行數(shù)據(jù)挖掘并得到三個(gè)規(guī)則集,分別是存在焊錫球缺陷時(shí)的規(guī)則集、不存在焊錫球缺陷時(shí)的規(guī)則集和兩種情況皆可能的規(guī)則集,這三個(gè)規(guī)則集對(duì)不存在焊錫球缺陷的印刷電路板的預(yù)測(cè)正確率接近100%,對(duì)存在焊錫球缺陷的印刷電路板的預(yù)測(cè)正確率接近50%,整體預(yù)測(cè)正確率達(dá)到97.66%。根據(jù)這些規(guī)則,焊錫球工藝可得到相應(yīng)的改進(jìn),其缺陷也可以及早發(fā)現(xiàn),極大地降低了電路板由于焊錫球缺陷而帶來(lái)的損失。
現(xiàn)有的釀酒工序中并沒(méi)有什么工具能夠提前檢測(cè)出預(yù)示著釀酒中存在瑕疵的早期征兆,因此也沒(méi)有辦法針對(duì)釀酒中出現(xiàn)的征兆進(jìn)行改進(jìn)。且釀酒工序環(huán)境復(fù)雜,相關(guān)數(shù)據(jù)繁多,如某關(guān)于釀酒的數(shù)據(jù)庫(kù)中即保存有29種數(shù)據(jù)記錄值,包括糖、醇類、有機(jī)酸、富氮化合物等。文獻(xiàn)針對(duì)上述釀酒數(shù)據(jù)庫(kù)采用數(shù)據(jù)挖掘方法,分出訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),先采用主成分分析法選出關(guān)鍵屬性對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行降維,然后采用K-means聚類迚行數(shù)據(jù)挖掘,獲取模式。利用聚類結(jié)果,研究人員得以在釀酒過(guò)程中就檢測(cè)出其產(chǎn)品質(zhì)量是否合栺,大大減少了由于釀酒出錯(cuò)帶來(lái)的損失。
發(fā)酵是一種生物化學(xué)反應(yīng),在食品工業(yè)、生物和化學(xué)工業(yè)中均有廣泛應(yīng)用。進(jìn)行一次發(fā)酵通常需要不短的時(shí)間,傳統(tǒng)上發(fā)酵過(guò)程經(jīng)常采用許多高科技手段諸如流動(dòng)注射分析法、液相色譜法、紅外先譜法、氣相色譜法、質(zhì)譜分析法等來(lái)實(shí)時(shí)監(jiān)測(cè)發(fā)酵過(guò)程的情況,以使其發(fā)酵過(guò)程始終處于正常范圍。但這些設(shè)備對(duì)于小型企業(yè)來(lái)說(shuō)都比較昂貴。文獻(xiàn)提出了另一種監(jiān)測(cè)發(fā)酵過(guò)程的方法,該方法只需用少許廉價(jià)的傳感器,獲得發(fā)酵過(guò)程中的各相關(guān)數(shù)據(jù)諸如pH值、溫度、溶解氧含量等,并對(duì)其進(jìn)行數(shù)據(jù)挖掘,即可實(shí)現(xiàn)發(fā)酵過(guò)程的實(shí)時(shí)異常監(jiān)測(cè)。數(shù)據(jù)挖掘過(guò)程采用文獻(xiàn)中提到的方法,得到具體發(fā)酵過(guò)程的模式,以此為依據(jù)實(shí)時(shí)監(jiān)測(cè)發(fā)酵過(guò)程的異常,并可根據(jù)特定的異常制定相應(yīng)解決方案。
2.2 故障檢測(cè)和診斷
在實(shí)際生產(chǎn)線上,任何一個(gè)小的故障不及時(shí)解決,都可能會(huì)影響到整個(gè)生產(chǎn)系統(tǒng)的正常運(yùn)行,帶來(lái)巨大的經(jīng)濟(jì)損失。因此,快速、準(zhǔn)確地進(jìn)行故障檢測(cè)、診斷和預(yù)警,一直是制造業(yè)企業(yè)迫切需求。然而,如上所述,生產(chǎn)線是一個(gè)復(fù)雜的系統(tǒng),整個(gè)生產(chǎn)線有數(shù)十道甚至上百道工序,每個(gè)工序有多級(jí)操作,每步操作又對(duì)應(yīng)不同的機(jī)器和設(shè)備。對(duì)于這樣的復(fù)雜系統(tǒng),用傳統(tǒng)方法去定量分析建模,找到異常狀況的影響因素是十分困難的。因此,即使經(jīng)驗(yàn)豐富的工程師,在面對(duì)一個(gè)原因未知的系統(tǒng)或工序故障時(shí),也不能短時(shí)間低開(kāi)銷解決問(wèn)題。而基于大數(shù)據(jù)的方法,有助于從多種復(fù)雜因素中找到造成異常的因素以及相應(yīng)的規(guī)則,因而對(duì)于故障檢測(cè)和診斷問(wèn)題有很好的效果。
文獻(xiàn)提出將聚類分析模型(自組織映射神經(jīng)網(wǎng)絡(luò)和模糊C均值)應(yīng)用到鋼鐵等冶金行業(yè),分析并找出生產(chǎn)數(shù)據(jù)中的異常點(diǎn),為進(jìn)一步發(fā)現(xiàn)生產(chǎn)過(guò)程的異常狀況或根據(jù)正確數(shù)據(jù)進(jìn)行更深層次的分析奠定基礎(chǔ)。文獻(xiàn)通過(guò)記錄6個(gè)屬性數(shù)據(jù)來(lái)描述電機(jī)設(shè)備的狀態(tài)信息,基于粗糙集思想提取其故障診斷規(guī)則,使得系統(tǒng)能夠通過(guò)設(shè)備的運(yùn)行狀態(tài)來(lái)實(shí)時(shí)監(jiān)測(cè)其生產(chǎn)狀況,及時(shí)檢測(cè)出設(shè)備故障,保證生產(chǎn)系統(tǒng)的正常運(yùn)行。文獻(xiàn)就半導(dǎo)體制造業(yè)中的缺陷檢測(cè)提出了RMI(RootCause Machine Identifier)綜合處理程序,其采用關(guān)聯(lián)規(guī)則得到預(yù)處理后數(shù)據(jù)庫(kù)的候選集。由于制造工序中許多間歇出現(xiàn)的問(wèn)題都是多因素引起的,且因素間非線性的相互作用十分常見(jiàn),因此RMI將計(jì)算出每個(gè)候選集的關(guān)趣度,并對(duì)其進(jìn)行排序,根據(jù)關(guān)趣度高低找到問(wèn)題根源。憑借RMI,制造過(guò)程中出現(xiàn)多種問(wèn)題都將被立即識(shí)別并定位出根源,相關(guān)人員得以高效解決相關(guān)的機(jī)器缺陷,從而極大地提高了產(chǎn)品產(chǎn)量和高質(zhì)量產(chǎn)品比例。文獻(xiàn)提出了FDC(Fault Detection andClassification)方法,首先采用主成分分析法整理訓(xùn)練數(shù)據(jù),建立模塊化的神經(jīng)網(wǎng)絡(luò)以進(jìn)行故障識(shí)別;D-S理論則是用于在存在不確定性的情況下(例如多故障產(chǎn)生或故障傳遞)進(jìn)行故障分類。采用模塊化神經(jīng)網(wǎng)絡(luò)和D-S理論的FDC方法具有在異常出現(xiàn)時(shí)快速識(shí)別異常,并定位該異常產(chǎn)生的根源部件的能力,使得相關(guān)人員能夠快速定位故障部件并采取相應(yīng)措施解決。文獻(xiàn)就土耳其一家毛毯制造公司的數(shù)據(jù),提出了基于C4.5決策樹(shù)算法的數(shù)據(jù)挖掘方案來(lái)快速識(shí)別定位毛毯制造流程中出現(xiàn)的故障原因,使得相關(guān)人員能夠快速精確解決故障,大大提高了毛毯的生產(chǎn)效率。其采用預(yù)處理技術(shù)提高所收集數(shù)據(jù)的質(zhì)量,使用關(guān)聯(lián)分析找到關(guān)鍵屬性集以減少訓(xùn)練數(shù)據(jù)的維度,最后采用C4.5決策樹(shù)算法,共得到101條規(guī)則,其識(shí)別故障原因的精準(zhǔn)度達(dá)到72.811%。
2.3 智能調(diào)度
提高生產(chǎn)效率在制造業(yè)生產(chǎn)過(guò)程中至關(guān)重要。在制造業(yè)中,生產(chǎn)調(diào)度是車間管理的核心,合理有效的車間調(diào)度是高效率生產(chǎn)的保障。文獻(xiàn)研究了基于大數(shù)據(jù)分析的車間調(diào)度問(wèn)題。對(duì)于離散工業(yè),針對(duì)靜態(tài)Job Shop調(diào)度問(wèn)題,提出了用決策樹(shù)模型提取調(diào)度知識(shí)的方法,優(yōu)化了調(diào)度方案;針對(duì)動(dòng)態(tài)Job Shop調(diào)度問(wèn)題,提出采用遺傳算法獲取優(yōu)化調(diào)度方案,再用極限學(xué)習(xí)機(jī)從優(yōu)化調(diào)度數(shù)據(jù)中提取新的調(diào)度規(guī)則,指導(dǎo)車間調(diào)度。對(duì)于流程工業(yè)中的單階段多產(chǎn)品批處理調(diào)度問(wèn)題,提出采用遺傳算法結(jié)合啟發(fā)式規(guī)則優(yōu)化加工設(shè)備分配方案,并用極限學(xué)習(xí)機(jī)預(yù)測(cè)訂單加工分配序列,實(shí)現(xiàn)訂單加工序列的快速確定。
在生產(chǎn)調(diào)度方面,決策樹(shù)模型受到了廣泛關(guān)注。文獻(xiàn)將生產(chǎn)計(jì)劃中不同交工期的工單加工順序、不同類型工件分配在同一機(jī)器時(shí)的加工順序等記錄存儲(chǔ)起來(lái),作為歷史數(shù)據(jù)訓(xùn)練決策樹(shù)模型,模型可根據(jù)實(shí)時(shí)數(shù)據(jù)為工件安排合適的機(jī)器進(jìn)行加工,使得車間能夠根據(jù)生產(chǎn)狀態(tài)進(jìn)行實(shí)時(shí)優(yōu)化調(diào)度,充分利用加工資源,達(dá)到效率最大化。文獻(xiàn)中也提到這一思想。文獻(xiàn)用決策樹(shù)模型對(duì)紡紗廠數(shù)據(jù)進(jìn)行分析,得到了機(jī)器細(xì)小位置移動(dòng)次數(shù)和機(jī)器效率對(duì)停止次數(shù)的影響,以此為依據(jù)調(diào)整、檢測(cè)機(jī)器,提高車間生產(chǎn)效率、加強(qiáng)人員、機(jī)器的調(diào)配。文獻(xiàn)對(duì)于典型機(jī)械制造企業(yè)業(yè)務(wù)流程中存在的問(wèn)題,運(yùn)用ID3決策樹(shù)算法,對(duì)企業(yè)質(zhì)量管理信息進(jìn)行挖掘,建立了處理部門歸屬?zèng)Q策模型,規(guī)范了管理流程,提高了管理效率。
2.4 能耗管理
除了保證產(chǎn)品質(zhì)量、排除設(shè)備故障和提高生產(chǎn)效率,對(duì)生產(chǎn)過(guò)程中的能耗進(jìn)行實(shí)時(shí)監(jiān)控,對(duì)于制造業(yè)企業(yè)來(lái)說(shuō)也是不可或缺的。如今的企業(yè)能源管理模式較為傳統(tǒng),主要依靠人工管理,系統(tǒng)集成化程度不高,缺少?zèng)Q策支持,能源利用率低。文獻(xiàn)針對(duì)煙草企業(yè),建立了企業(yè)能源管理系統(tǒng),集中監(jiān)控了企業(yè)生產(chǎn)中的供水系統(tǒng)、壓縮空氣系統(tǒng)、供配電系統(tǒng)和鍋爐系統(tǒng),并采用線性回歸、殘差灰色和附加動(dòng)量的前饋神經(jīng)網(wǎng)絡(luò)模型,對(duì)企業(yè)的能效進(jìn)行了監(jiān)控和預(yù)測(cè),保證了企業(yè)的用能安全和效率;文獻(xiàn)針對(duì)造紙業(yè),將其制造過(guò)程中的電耗、氣耗分為四類能耗,對(duì)每類能耗先使用偏最小二乘法(PLS)從眾多能源影響因素中選出具有重要影響的因素,然后利用這些因素建立神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了對(duì)造紙過(guò)程各工序能耗的有效預(yù)測(cè),為企業(yè)的能源管理控制提供了重要的決策依據(jù)。
3 采購(gòu)階段
采購(gòu)階段主要涉及的問(wèn)題是優(yōu)化庫(kù)存和節(jié)約成本。
3.1 庫(kù)存優(yōu)化
庫(kù)存量適當(dāng)是確保企業(yè)正常連續(xù)生產(chǎn)的必要條件,庫(kù)存量過(guò)多或多少都會(huì)造成不必要的經(jīng)濟(jì)損失。為了減少貨物的積存,省去不必要的庫(kù)存開(kāi)銷,制造業(yè)中產(chǎn)生了按訂單裝配的策略,該策略將產(chǎn)品的裝配操作推遲,直到客戶下了訂單。這樣一來(lái),庫(kù)存中的都是產(chǎn)品的組件,可根據(jù)客戶要求進(jìn)行裝配;而不是已裝配好了的成品,等有需求的客戶購(gòu)買。該策略從根本上解決了貨物的積存情況,也省去了大量的庫(kù)存開(kāi)銷。但由于按訂單裝配的策略,工廠在得到訂單后才開(kāi)始進(jìn)行產(chǎn)品的裝配,因此裝配的時(shí)間將直接影響到工廠交貨到客戶的時(shí)間。這意味著裝配過(guò)程中出現(xiàn)任何耽誤時(shí)間的情況(如返工等),都將影響交貨的時(shí)間。
文獻(xiàn)針對(duì)某有色冶金企業(yè),采用改進(jìn)的遺傳算法、神經(jīng)網(wǎng)絡(luò)和模糊控制方式完善庫(kù)存優(yōu)化系統(tǒng)。文獻(xiàn)采用進(jìn)化規(guī)劃算法對(duì)庫(kù)存模型進(jìn)行優(yōu)化,以提高企業(yè)的經(jīng)濟(jì)效益。文獻(xiàn)關(guān)注在后期裝配過(guò)程中,裝配順序?qū)Ξa(chǎn)品質(zhì)量的影響,并采用關(guān)聯(lián)規(guī)則方法從歷史數(shù)據(jù)中抽取出11條規(guī)則,經(jīng)專家整理分析,獲得更加清晰簡(jiǎn)潔的規(guī)則和知識(shí)。根據(jù)這些規(guī)則,產(chǎn)品在組裝前即可對(duì)裝配序列進(jìn)行優(yōu)化,其成品出現(xiàn)瑕疵品的幾率大大減少。文獻(xiàn)用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)模型對(duì)大型制造業(yè)企業(yè)庫(kù)存安全水平進(jìn)行預(yù)測(cè),用灰色聚類法對(duì)庫(kù)存中產(chǎn)品和原材料進(jìn)行重要性劃分,以幫助企業(yè)控制和優(yōu)化庫(kù)存。
備件管理是制造業(yè)設(shè)備管理中的重要環(huán)節(jié)。如何運(yùn)用最少的資金來(lái)保證最優(yōu)的備件供應(yīng)與管理,并不斷提高設(shè)備的可靠性、維修性和經(jīng)濟(jì)性是一個(gè)重要的課題。周期補(bǔ)充是目前很多企業(yè)普遍采用的備品備件管理模式,訂購(gòu)量Q和訂購(gòu)點(diǎn)s是周期補(bǔ)充控制法的兩個(gè)基本控制參數(shù)。文獻(xiàn)基于(s,Q)的故障持續(xù)時(shí)間分布和生命周期分布模型,提出了一個(gè)基于效用的庫(kù)存管理模型(τ, Tm),該模型考慮了技術(shù)折舊和資金擠壓所帶來(lái)的影響,也光服了供貨周期隨機(jī)性導(dǎo)致的缺貨損失、故障率過(guò)低導(dǎo)致的庫(kù)存冗余維護(hù)損失等問(wèn)題。在機(jī)械制造業(yè)中,許多大數(shù)據(jù)分析挖掘模型都有很好的應(yīng)用。文獻(xiàn)提出了基于主成分分析和支持向量機(jī)的模型進(jìn)行備件需求的預(yù)測(cè),獲得了較好的預(yù)測(cè)精度,預(yù)測(cè)結(jié)果可以作為管理者的決策依據(jù)。文獻(xiàn)用關(guān)聯(lián)規(guī)則分析機(jī)械制造企業(yè)外購(gòu)件間的隱含關(guān)系,有助于企業(yè)合理制定采購(gòu)計(jì)劃,有效控制采購(gòu)資金。
成品的庫(kù)存量關(guān)聯(lián)著產(chǎn)品的生產(chǎn)、銷售等過(guò)程。文獻(xiàn)針對(duì)服裝企業(yè)庫(kù)存管理,通過(guò)庫(kù)存周轉(zhuǎn)率、商品保本儲(chǔ)存期、動(dòng)銷率、高中低檔商品消費(fèi)能力等數(shù)據(jù),對(duì)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,企業(yè)可以依據(jù)訓(xùn)練完成的模型預(yù)測(cè)產(chǎn)品的庫(kù)存量,并依據(jù)預(yù)測(cè)結(jié)果安排生產(chǎn),進(jìn)而減輕了商品庫(kù)存堆積的情況,緩解企業(yè)訂貨瓶頸。
此外,庫(kù)存作為供應(yīng)鏈的一個(gè)重要組成,其優(yōu)化過(guò)程常常與整個(gè)供應(yīng)鏈密不可分。例如,生產(chǎn)、庫(kù)存與配送聯(lián)合優(yōu)化調(diào)度問(wèn)題是供應(yīng)鏈中的一個(gè)復(fù)合問(wèn)題,該問(wèn)題要涉及供應(yīng)鏈中制造商以及零售商的生產(chǎn)、庫(kù)存、配送及缺貨成本等。文獻(xiàn)提出可以基于大數(shù)據(jù)分析方法,綜合分析生產(chǎn)消耗、采購(gòu)及銷售情況,找出保證企業(yè)正常生產(chǎn)的原材料合理庫(kù)存量,以優(yōu)化原材料庫(kù)存;根據(jù)設(shè)備使用、維修和保養(yǎng)原始記錄找出關(guān)鍵備件磨損規(guī)律,從而預(yù)測(cè)其壽命,為備件庫(kù)存控制提供依據(jù)。在具體的應(yīng)用中,文獻(xiàn)基于禁忌搜索算法、模擬退火算法優(yōu)化了生產(chǎn)、庫(kù)存與配送的聯(lián)合調(diào)度問(wèn)題。文獻(xiàn)提出建立制造業(yè)企業(yè)采購(gòu)決策支持系統(tǒng),通過(guò)關(guān)聯(lián)規(guī)則分析產(chǎn)品價(jià)格、供應(yīng)商評(píng)價(jià)、退貨原因等問(wèn)題間的關(guān)聯(lián)關(guān)系,幫助企業(yè)進(jìn)行采購(gòu)方案的制定。文獻(xiàn)以汽車產(chǎn)品一個(gè)季度的銷量作為數(shù)據(jù)挖掘?qū)ο?,在建立采?gòu)業(yè)務(wù)數(shù)據(jù)集市的基礎(chǔ)上,運(yùn)用ID3決策樹(shù)模型進(jìn)行數(shù)據(jù)挖掘,為采購(gòu)業(yè)務(wù)的管理者在制定采購(gòu)計(jì)劃時(shí)提供重要的參考依據(jù)。
3.2 成本優(yōu)化
制造業(yè)中大量依賴原材料和生產(chǎn)設(shè)備,因此制造業(yè)中采購(gòu)成本在企業(yè)總運(yùn)行成本中占比很大。例如,煤礦企業(yè)在原煤開(kāi)采過(guò)程中所消耗的材料種類繁多、數(shù)量巨大,材料成本占總成本的20%、直接成本的35%。同時(shí),煤礦材料投入也是最具可控性的項(xiàng)目,通過(guò)準(zhǔn)確預(yù)測(cè)材料成本,有效控制材料消耗,可以降低原煤生產(chǎn)成本、提高煤礦企業(yè)的競(jìng)爭(zhēng)力。文獻(xiàn)運(yùn)用粒子群(PSO)優(yōu)化算法對(duì)支持向量機(jī)模型的參數(shù)進(jìn)行優(yōu)化,極建基于粒子群優(yōu)化的支持向量回歸機(jī)(PSO-SVR)煤礦材料成本預(yù)測(cè)模型對(duì)相關(guān)煤礦材料的成本進(jìn)行預(yù)測(cè),進(jìn)而從材料需求計(jì)劃和采購(gòu)計(jì)劃的制定、材料成本控制、材料成本管理信息化等方面提出了煤礦材料成本管理的政策建議。文獻(xiàn)提到運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型,通過(guò)學(xué)習(xí)制造業(yè)采購(gòu)數(shù)據(jù)倉(cāng)庫(kù)中的采購(gòu)歷史數(shù)據(jù),對(duì)采購(gòu)價(jià)栺進(jìn)行時(shí)間序列的預(yù)測(cè),預(yù)測(cè)結(jié)果能夠滿足企業(yè)決策的需要。
降低采購(gòu)成本、優(yōu)化采購(gòu)方案的一項(xiàng)重要舉措是合理選擇供應(yīng)商。文獻(xiàn)提出用關(guān)聯(lián)規(guī)則(改進(jìn)的Apriori算法)方法來(lái)解決離散制造企業(yè)零部件供應(yīng)商選擇問(wèn)題。文獻(xiàn)建立基于關(guān)聯(lián)規(guī)則的裝備制造業(yè)供應(yīng)商質(zhì)量評(píng)價(jià)模型,指導(dǎo)企業(yè)采購(gòu)時(shí)評(píng)價(jià)和選擇供應(yīng)商。
4 銷售階段
在銷售階段,大數(shù)據(jù)分析的應(yīng)用主要體現(xiàn)在預(yù)測(cè)產(chǎn)量、銷量、發(fā)現(xiàn)需求和優(yōu)化配送方案上。
4.1 產(chǎn)銷量預(yù)測(cè)
制造業(yè)的銷售主體是其制造的產(chǎn)品,產(chǎn)品的產(chǎn)量和銷量影響著整個(gè)供應(yīng)鏈。因此,銷售階段的重要任務(wù)之一就是準(zhǔn)確、合理地預(yù)測(cè)產(chǎn)品的產(chǎn)量和銷量。
在產(chǎn)量預(yù)測(cè)方面,文獻(xiàn)提出了一種基于動(dòng)態(tài)改進(jìn)多元線性回歸模型的次年產(chǎn)量預(yù)測(cè)方法,運(yùn)用到某航空制造企業(yè)的次年產(chǎn)量預(yù)測(cè)中,證明了該模型的預(yù)測(cè)實(shí)用性;文獻(xiàn)提出了基于有動(dòng)量的自適應(yīng)梯度下降法BP神經(jīng)網(wǎng)絡(luò)模型,并用它對(duì)攀枝花市的鋼產(chǎn)量進(jìn)行預(yù)測(cè),實(shí)例表明該系統(tǒng)具有使用價(jià)值;文獻(xiàn)基于RouGh集理論實(shí)現(xiàn)了薄膜蒸發(fā)器的產(chǎn)量預(yù)測(cè),研究結(jié)果找出了對(duì)產(chǎn)量影響較大的因素,對(duì)產(chǎn)量的預(yù)測(cè)基本符合實(shí)際。
在銷量預(yù)測(cè)方面,文獻(xiàn)運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型,以月份因子(根據(jù)經(jīng)驗(yàn)對(duì)產(chǎn)品淡旺季的描述)和歷史月銷售量為輸入量對(duì)某電機(jī)企業(yè)五種產(chǎn)品進(jìn)行銷量預(yù)測(cè),得到了較好的預(yù)測(cè)結(jié)果。文獻(xiàn)采用了滑動(dòng)平均和指數(shù)平滑法對(duì)PVC主型材銷量進(jìn)行預(yù)測(cè),為生產(chǎn)計(jì)劃制定、作業(yè)控制、庫(kù)存控制等生產(chǎn)管理環(huán)節(jié)提供決策基礎(chǔ)。文獻(xiàn)提出了改進(jìn)遺傳算法結(jié)合Holt-winters的銷售預(yù)測(cè)模型,并對(duì)實(shí)際卷煙銷售量進(jìn)行了預(yù)測(cè),預(yù)測(cè)結(jié)果準(zhǔn)確率90%以上。文獻(xiàn)用時(shí)間序列分析預(yù)測(cè)流行飾品在不同區(qū)域的未來(lái)直銷趨勢(shì),幫助管理人員制定銷售策略,并合理安排生產(chǎn)、采購(gòu)計(jì)劃,提高利潤(rùn)。
4.2 需求發(fā)現(xiàn)
隨著市場(chǎng)經(jīng)濟(jì)的逐漸完善,客戶需求知識(shí)的作用越來(lái)越大,其中隱藏著消費(fèi)者對(duì)產(chǎn)品的個(gè)性化需求以及產(chǎn)品未來(lái)的發(fā)展趨勢(shì)等信息。客戶需求的日漸多樣化和個(gè)性化,要求企業(yè)能夠快速響應(yīng)市場(chǎng),在高質(zhì)量低成本前提下以最短時(shí)間開(kāi)發(fā)客戶需要的產(chǎn)品,制定符合客戶需求的銷售策略。基于大數(shù)據(jù)分析的方法,對(duì)海量銷售歷史數(shù)據(jù)進(jìn)行建模,能夠準(zhǔn)確地幫助企業(yè)發(fā)現(xiàn)需求。文獻(xiàn)從卡車制造商的視角出發(fā),將大數(shù)據(jù)分析方法綜合應(yīng)用到經(jīng)銷商的客戶價(jià)值分析中:用聚類模型進(jìn)行經(jīng)銷商細(xì)分;用決策樹(shù)模型分析經(jīng)銷商的重要程度;用關(guān)聯(lián)規(guī)則分析經(jīng)銷商訂購(gòu)車型間的關(guān)系以進(jìn)行品牌推廣;用異常檢測(cè)方法分析經(jīng)銷商流失;用神經(jīng)網(wǎng)絡(luò)模型綜合分析經(jīng)銷商價(jià)值。上述模型在相應(yīng)場(chǎng)景中的也應(yīng)用具有一定的通用性。文獻(xiàn)將關(guān)聯(lián)規(guī)則算法運(yùn)用到筆記本電腦BTO(Build to Order)生產(chǎn)計(jì)劃中,基于BTO制造的特點(diǎn),采用了分類、多最小支持和增量挖掘的改進(jìn)算法,挖掘PC用戶配置選擇的關(guān)聯(lián)關(guān)系,以此制定生產(chǎn)計(jì)劃。文獻(xiàn)提出用關(guān)聯(lián)規(guī)則模型挖掘鐘表企業(yè)物料清單(BOM)中的歷史數(shù)據(jù),分析不同零部件組合的產(chǎn)品的客戶認(rèn)可度和盈利能力,以此為基礎(chǔ)制定營(yíng)銷策略。文獻(xiàn)以機(jī)械制造企業(yè)為景,運(yùn)用決策樹(shù)枝技術(shù)中的CART算法對(duì)企業(yè)已有客戶群數(shù)據(jù)進(jìn)行分析,得到了企業(yè)忠誠(chéng)客戶預(yù)測(cè)模型。該模型可以幫助企業(yè)發(fā)現(xiàn)和培養(yǎng)忠誠(chéng)客戶。文獻(xiàn)對(duì)煙草企業(yè)客戶忠誠(chéng)度指標(biāo)極造分類決策樹(shù)模型,通過(guò)改進(jìn)的K-means算法,按客戶的價(jià)值貢獻(xiàn)度對(duì)客戶進(jìn)行聚類分析,以此劃分了客戶營(yíng)銷等級(jí)。對(duì)不同等級(jí)客戶制定相應(yīng)的營(yíng)銷策略,實(shí)現(xiàn)精細(xì)化營(yíng)銷。采用馬爾柯夫預(yù)測(cè)法實(shí)現(xiàn)客戶等級(jí)變化預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果調(diào)整營(yíng)銷策略。文獻(xiàn)提出基于企業(yè)的客戶盈利能力數(shù)據(jù),用聚類方法預(yù)測(cè)企業(yè)未來(lái)的盈利能力,并將企業(yè)資源有效投入到能為公司帶來(lái)更大利潤(rùn)的客戶上。文獻(xiàn)使用市場(chǎng)值函數(shù)的方法,建立了紅塔集團(tuán)促銷活動(dòng)相應(yīng)模型,預(yù)測(cè)客戶的市場(chǎng)值并以此為依據(jù)將客戶排序,從而幫助促銷活動(dòng)策劃人員制定有針對(duì)性的促銷方案。中國(guó)的制造業(yè)主要是以產(chǎn)業(yè)集群的形式存在,文獻(xiàn)針對(duì)傳統(tǒng)制造業(yè)集群,引入行業(yè)作為控制變量對(duì)全部樣本進(jìn)行回歸分析,發(fā)現(xiàn)集群企業(yè)規(guī)模和創(chuàng)新能力與服務(wù)需求之間的關(guān)系。
4.3 配送優(yōu)化
配送是銷售階段乃至整個(gè)供應(yīng)鏈中至關(guān)重要的環(huán)節(jié),是企業(yè)競(jìng)爭(zhēng)中不可或缺的一環(huán)。制造業(yè)的物流系統(tǒng)以射頻識(shí)別(ratio frequencyidentification,RFID)技術(shù)為核心。文獻(xiàn)給出配送優(yōu)化的思路:通過(guò)路由算法,對(duì)一系列特定位置和需求量的客戶點(diǎn),安排一定數(shù)量的運(yùn)輸車輛,在特定約束條件下達(dá)到配送速度最快、配送成本最低。文獻(xiàn)提出針對(duì)RFID產(chǎn)生的海量數(shù)據(jù),基于深度優(yōu)先搜索(DFS)挖掘頻繁路徑,并以此為基礎(chǔ)根據(jù)物品路徑歷史數(shù)據(jù)預(yù)測(cè)物品達(dá)到的下一位置及時(shí)間,以輔助企業(yè)進(jìn)行物流配送管理和優(yōu)化。文獻(xiàn)基于遺傳算法和免疫算法,分析了配送中心選址和配送路徑優(yōu)化的問(wèn)題,設(shè)計(jì)了以最小化成本為目的的數(shù)學(xué)模型,并以某漁業(yè)企業(yè)的配送優(yōu)化問(wèn)題證實(shí)了研究結(jié)果的可用性;文獻(xiàn)針對(duì)物流配送優(yōu)化中聚類分析,旅行商問(wèn)題和車輛路徑問(wèn)題這三個(gè)最基本的子問(wèn)題,在顧客需求存在性隨機(jī)和需求量隨機(jī)的背景下,給出各子問(wèn)題的數(shù)學(xué)模型和相應(yīng)算法,并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了算法的有效性;文獻(xiàn)對(duì)供應(yīng)鏈中分銷配送優(yōu)化模型及其求解算法展開(kāi)研究,重點(diǎn)進(jìn)行了供應(yīng)鏈多級(jí)分銷系統(tǒng)優(yōu)化模型及其多目標(biāo)混合遺傳算法和物流配送優(yōu)化模型及其多目標(biāo)遺傳算法兩方面的研究。
5 售后階段
售后階段主要為已售商品提供配套的服務(wù),其內(nèi)容有服務(wù)類型識(shí)別和產(chǎn)品運(yùn)行狀態(tài)監(jiān)控等。
5.1 服務(wù)類型識(shí)別
服務(wù)類型識(shí)別在以汽車行業(yè)為代表的消費(fèi)型產(chǎn)品制造業(yè)中具有舉足輕重的地位。在汽車行業(yè)中,40%~60%的利潤(rùn)在服務(wù)、維修等售后服務(wù)領(lǐng)域。傳統(tǒng)的售后服務(wù)模式是在客戶遇到問(wèn)題時(shí)主動(dòng)聯(lián)系企業(yè),企業(yè)被動(dòng)提供服務(wù),這種模式會(huì)使企業(yè)損失許多潛在客戶價(jià)值。隨著信息技術(shù)的發(fā)展,許多企業(yè)嘗試將信息技術(shù)運(yùn)用到客戶服務(wù)中,由此出現(xiàn)了客戶關(guān)系管理(CRM)的概念。在CRM中引入大數(shù)據(jù)分析,能夠幫助企業(yè)進(jìn)行客戶群分析,發(fā)掘潛在客戶,預(yù)測(cè)流失客戶,細(xì)分客戶群,使企業(yè)能夠主動(dòng)地、有針對(duì)性的制定客戶服務(wù)策略。文獻(xiàn)提出圍繞客戶細(xì)分、客戶支持、交叉營(yíng)銷、客戶流失預(yù)警等方面,采用關(guān)聯(lián)規(guī)則、聚類、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)等模型,挖掘客戶潛在服務(wù)需求,主動(dòng)為客戶提供相應(yīng)服務(wù),以創(chuàng)造更大的客戶價(jià)值。文獻(xiàn)提出用序列模式挖掘的方法分析汽車用戶的使用、保養(yǎng)與維修情況,找到其中的特殊規(guī)律,實(shí)現(xiàn)為汽車用戶提供個(gè)性化的服務(wù)。文獻(xiàn)提出在制造業(yè)售后服務(wù)中用ID3決策樹(shù)算法分析客戶評(píng)價(jià)信息,得到產(chǎn)品指標(biāo)綜合滿意度結(jié)果,為企業(yè)質(zhì)量功能展開(kāi)(QFD)的實(shí)現(xiàn)奠定基礎(chǔ)。文獻(xiàn)提出在CRM中應(yīng)用關(guān)聯(lián)規(guī)則和序列分析等方法預(yù)測(cè)客戶行為,用分類和聚類方法進(jìn)行客戶分。文獻(xiàn)提出用聚類分析對(duì)企業(yè)的客戶群進(jìn)行細(xì)分,以針對(duì)不同客戶群制定相應(yīng)的管理策略。文獻(xiàn)提出在制造業(yè)客戶關(guān)系管理(CRM)中引入聚類分析和ID3決策樹(shù)算法,對(duì)客戶歷史數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)潛在流失客戶,以幫助企業(yè)提早采取措施挽留客戶。文獻(xiàn)針對(duì)通信設(shè)備制造業(yè),用關(guān)聯(lián)規(guī)則(FP-Growth)分析不同地區(qū)的銷售特征,以預(yù)測(cè)流失客戶;針對(duì)C4.5算法處理大量數(shù)據(jù)時(shí)耗時(shí)長(zhǎng)的問(wèn)題,提出自適應(yīng)匹配和交叉驗(yàn)證的改進(jìn)方法,并用改進(jìn)算法判斷會(huì)購(gòu)買增值服務(wù)的客戶,以發(fā)掘潛在客戶。
隨著用戶生成內(nèi)容的大量增長(zhǎng),在線評(píng)論成為挖掘客戶對(duì)產(chǎn)品和服務(wù)的意見(jiàn)的極有價(jià)值的來(lái)源。然而,大多數(shù)傳統(tǒng)的意見(jiàn)挖掘方法是粗粒度的,不能理解自然語(yǔ)言。文獻(xiàn)提出一種無(wú)監(jiān)督的方法,從評(píng)論中提取評(píng)價(jià)表達(dá)模式(AEP),它代表了人們對(duì)產(chǎn)品或服務(wù)表達(dá)意見(jiàn)的方式,并且可以被視為方面和情感詞之間的句法關(guān)系的精簡(jiǎn)表示。設(shè)計(jì)基于AEP的潛在狄利光雷分配模型(AEP-LDA),用于層面和情緒詞的識(shí)別。
如今與Web交互的主要方式是通過(guò)瀏覽器通過(guò)以人類可讀的方式呈現(xiàn)信息來(lái)操縱信息。然而,向Web上的許多進(jìn)程的自動(dòng)化的演進(jìn)可能導(dǎo)致計(jì)算機(jī)到計(jì)算機(jī)的交互在當(dāng)前的人到計(jì)算機(jī)交互中變得占優(yōu)勢(shì)。文獻(xiàn)提出基于規(guī)劃的服務(wù)組合算法,其與潛在的大規(guī)模服務(wù)廣告目錄動(dòng)態(tài)交互,以便用戶按需檢索匹配的服務(wù)廣告。
5.2 運(yùn)行狀態(tài)監(jiān)控
對(duì)產(chǎn)品的運(yùn)行狀態(tài)進(jìn)行監(jiān)控,可以幫助企業(yè)掌握產(chǎn)品的運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)問(wèn)題,以便快速制定有針對(duì)性的服務(wù)策略。文獻(xiàn)將聚類算法和關(guān)聯(lián)規(guī)則算法相結(jié)合,實(shí)現(xiàn)依據(jù)大量數(shù)據(jù)對(duì)挖掘機(jī)故障關(guān)聯(lián)關(guān)系的概率預(yù)測(cè),從而進(jìn)行有效地預(yù)防,并為生產(chǎn)商提供數(shù)據(jù)支持;文獻(xiàn)采用基于邏輯數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘模式,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)、K-means聚類分析算法和FP-Growth關(guān)聯(lián)規(guī)則算法對(duì)汽車售后的潛在故障進(jìn)行分析;文獻(xiàn)將維護(hù)工人在進(jìn)行提升機(jī)各個(gè)系統(tǒng)維護(hù)行為之前的監(jiān)控?cái)?shù)據(jù)進(jìn)行刪減和去噪,用所得數(shù)據(jù)訓(xùn)練C4.5決策樹(shù)模型,表征故障隱患;文獻(xiàn)基于模糊神經(jīng)網(wǎng)絡(luò)的智能診斷算法,根據(jù)實(shí)時(shí)獲取的工程起重車運(yùn)行參數(shù),實(shí)現(xiàn)對(duì)起重車進(jìn)程實(shí)時(shí)故障診斷。
隨著設(shè)備故障復(fù)雜程度的不斷加深,具有隱蔽性、突發(fā)性、誘因多、復(fù)雜性和不確定性等特征的隱形故障成為復(fù)雜設(shè)備突發(fā)故障的主要誘因。文獻(xiàn)采用增量更新算法使Ariori關(guān)聯(lián)規(guī)則算法能夠?qū)崟r(shí)快速隨故障數(shù)據(jù)庫(kù)的更新而更新,以更好地對(duì)設(shè)備故障進(jìn)行在線預(yù)警和診斷,然后引入BP神經(jīng)網(wǎng)絡(luò)的方法解決隱形故障這類不確定性因素較多的非線性問(wèn)題。
6 結(jié)束語(yǔ)
本文介紹了制造業(yè)大數(shù)據(jù)的概念,討論了制造業(yè)大數(shù)據(jù)的特點(diǎn)、制造業(yè)大數(shù)據(jù)分析的特點(diǎn)與挑戰(zhàn)。本文按制造業(yè)的通用流程將制造業(yè)劃分為設(shè)計(jì)、生產(chǎn)、采購(gòu)、銷售和售后五個(gè)環(huán)節(jié),闡述了各個(gè)環(huán)節(jié)中主要業(yè)務(wù)場(chǎng)景的任務(wù)需求,并總結(jié)了大數(shù)據(jù)分析模型在這些場(chǎng)景中的應(yīng)用的研究進(jìn)展??梢钥吹?,在制造業(yè)的諸多業(yè)務(wù)場(chǎng)景中均面臨著復(fù)雜的預(yù)測(cè)、優(yōu)化問(wèn)題,傳統(tǒng)的人工經(jīng)驗(yàn)和統(tǒng)計(jì)分析方法解決這些問(wèn)題的效果有待提高。而大數(shù)據(jù)分析為這些問(wèn)題的解決提供了新的思路,并取得了較為滿意的實(shí)驗(yàn)結(jié)果。
然而,大數(shù)據(jù)技術(shù)在制造業(yè)中的應(yīng)用,還面臨著諸多挑戰(zhàn)。在技術(shù)方面,文中涉及的研究成果多處于實(shí)驗(yàn)階段,其實(shí)驗(yàn)數(shù)據(jù)多為人工篩選和審查的高質(zhì)量數(shù)據(jù),而實(shí)際生產(chǎn)環(huán)境中面臨著許多數(shù)據(jù)質(zhì)量問(wèn)題。此外,將上述模型和算法部署于實(shí)際場(chǎng)景,還需考慮諸多因素,如模型的通用性、靈活性和魯棒性,以及算法的實(shí)際性能等;在管理方面,研究者和企業(yè)管理人員還需考慮如何將大數(shù)據(jù)分析方案合理整合到企業(yè)的業(yè)務(wù)邏輯中,以使其真正發(fā)揮作用。