S2EP.14 探索商機:發現企業數據中的潛在價值
🤖 頻道主持人:主持人Monica
🤖 來賓:產品事業部 工程師 陳建名Matt
💡本集重點:
► 01:07 您能否先簡單介紹一下您的背景,以及您是如何進入這個領域的?
- 過去從事網頁資料庫後端的程式設計工作,於2021年入職哈瑪星科技。
- 研究所專業背景為資料科學領域。
► 01:55 您認為資料探勘和數據分析在現代企業中的角色是什麼?為什麼它們這麼重要?
- 數據分析常常應用在零售業、電商產業等等,可以預測分析進貨品項、進貨量,能整合店員的經驗並排除人為的偏誤進行分析。
- 數據呈現的是客觀資訊,透過歷史分析篩選出可解釋的、客觀的、無法被改變的數據資料,這種知識具有一定的可信任度。
- 以營利企業的角度看數據分析的五個價值:1.資料探勘挖掘市場趨勢、2.預測客戶行為、3.優化業務流程、4.預防風險、5.使用AI協助決策,讓數據成為新世紀的寶藏。
► 05:12 您能否解釋一下什麼是維度分析和資料探勘?它們如何應用於企業數據中?
- 常見的資料分析會以數據介接方式匯整至儀表板、戰情室做呈現,後續能在進一步做維度分析。
- 透過過往銷售紀錄,針對不同地區、不同行為特徵做的維度分析,使用的AI模型也會有所不同。
- 數據分析很難憑介單一團隊KNOW-HOW就打造出符合各產業需求的AI系統,需要與業者訪談過往經驗的依據、找出關聯性、假設情境等,透過AI模型驗證假設,用科學的方式完善化。
► 09:01 我們經常聽到一些網站推薦系統的演算法,特別是在電商、影音平台上。您能分享一下推薦系統是如何運作的,並舉一些成功的例子嗎?
- 線上影音平台演算法透過特徵,如:影片時長、類型、歌手、曲風,數據判定找出你可能喜歡的類型,同時也會透過判定使用裝置,如:行動載具無法做長時間閱讀,演算出影片排序。
- 生活當中的演算法,如:全聯在購買女性用品時,架上同時提供巧克力商品的選擇,就是一種購物籃分析的演算法,可以透過資料科學挖掘出來。
- 商家通過經驗法則,也許可以判定出客人購買行為,但透過AI模型的分析能對應出更可信數值,可以改進實體店面銷售的客戶滿意度。
► 13:01 演算法如何產生?
- 需要搭配客戶描述的情境、現有資料,結合已知的演算去做交集。
- AI模型需要透過數據養成,不是所有數據都能做出AI模型,需要通過開發人員使用特定深度學習、分類回歸等演算法打造出符合特定需求的AI。
► 15:30 您是否能分享一些您親自參與過的成功案例,展示如何通過數據探勘和AI技術幫助企業發現商機?
- 知名精油廠商,情境:透過AI分析,將產品做更精準的個人化推薦,像是年齡、消費力、症狀等消費者特徵,提供相對應可使用的精油產品。
- 建立專屬的AI系統資料庫後,推薦系統會根據個人特徵、消費紀錄、症狀搭配的精油類型,提供購物選單排序。
- 使用購物籃分析、NLP技術、使用者分析等,將相同族群購買的商品進一步推薦給使用者,讓使用者體驗做到做大提升。
► 19:20 AI預測技術現在非常熱門,您認為它的未來發展趨勢如何?
- 早期做資料科學是採統計學的方式,像是使用excel做圖表的拖拉,以及趨勢性的預測。
- 後來開始流行使用類神經網的深度學習做法,透過神經網路的自動迭代修正功能,能預測出相對應的結果。
- 使用演算法需要具備很多先決條件,設備問題、數據來源、參數,基底建設必須建設好才能實現演算法功能。
- 近幾年開始對非結構化數據進行分析,如:圖像、語音、文章,透過AI挖掘內容去做更廣泛的應用。
► 23:00 在企業應用這些技術時,會面臨哪些挑戰?
- 數據質量問題:建構AI系統前,必須確保數據來源的可靠性、基礎建設完善,數據缺失或是錯誤需要進行資料清洗的過程,佔AI開發的70~80%時間。
- 基礎建設的挑戰:交通車流預測分析,特定路段才有偵測器的數據能分析,偏鄉、偏遠路段資料缺失問題。
- 道德和隱私考量:蒐集資料時會牽涉法條、數據所有權等問題,資訊安全議題的精神是為了避免難預期的風險,而產生相對應的限制,與AI系統開發是有衝突的。