隨著資訊技術的發展與數據學科的演進,過往以媒體版位作為數位影音廣告投放選擇的作法,已經無法滿足廣告主的需求,數據驅動的智慧廣告時代著重的目標是找尋到特定屬性的目標族群,亦即所謂的消費者輪廓,藉由鎖定特定屬性的消費者來進行廣告投放,跳脫媒體版位的限制,並且依特定屬性需求進行產品與廣告訊息的傳遞,發揮最大的廣告效益。

 

OneAD 致力於數據科技研發,針對消費者於網路媒體上的瀏覽歷程進行分析,以數據科學與深度學習算法,對應第三方量測公司 (ComScore) 與 Google DoubleClick Bid Manager 的數據,建立模型來推測出消費者的年齡性別屬性。

 

以下說明OneAD如何使用深度學習演算法於消費者年齡性別屬性預測:

 

應用深度學習演算法於消費者年齡性別屬性預測

 

在所有消費者輪廓中,最基本的莫屬年齡性別屬性。廣告主在開發產品/服務之初,都會先定義目標顧客族群,才能以目標顧客的需求為導向,開發出合適或符合市場趨勢的產品/服務,所以,產品/服務在做行銷廣告活動時,也會希望能向設定的目標顧客說話,期望能向正確的對象傳遞正確的訊息。為此 OneAD 積極研發深度學習的消費者年齡性別屬性預測技術,以便提供符合廣告主策略的目標消費族群,進行產品/服務對話。整個技術流程與程序,大致如圖1所示:

 

圖1: 應用深度學習演算法於消費者年齡性別屬性預測的處理流程
圖1: 應用深度學習演算法於消費者年齡性別屬性預測的處理流程

 

  • 建立深度學習模型以前項收集到的數據為基礎,將對應的消費者瀏覽網站紀錄,包括網站、網站內容、時間等數據,建立多層次的深度學習架構,包括:
    • 卷積神經網路 (Convolutional Neural Network, CNN):萃取出消費者瀏覽紀錄中與年齡性別屬性高度相關的特徵值。
    • 長短期記憶網路 (Long Short-Term Memory, LSTM 是一種時間遞歸神經網絡 Recurrent Neural Network, RNN):建立消費者瀏覽紀錄間,序列化數據的前後關聯與特症。
    • 優化效果技術,如最大池化處理 (MaxPooling)、隨機丟棄(Dropout)與激勵函數的應用等:提升模型的準確度。

    經過多次時期 (epoch) 的運作執行,取得最佳的參數設定並據以建立預測模式,然後經驗證數據與測試數據進行驗證,以確保模型的可行性與效度。值得注意的是,模型的訓練將隨著輸入數據的更新而重新訓練,所以以我們會定期調整模型以便能隨時保持最佳成效。

    整個深度學習模型的架構大致如圖2。

     

     

    應用深度學習演算法於消費者年齡性別屬性預測的圖層架構
    圖2: 應用深度學習演算法於消費者年齡性別屬性預測的圖層架構

     

  • 定義年齡性別屬性
    為提供消費者年齡性別屬性,我們首先以第三方數據提供者 comScore,定義各年齡性別消費者群體區間,主要分成 15-17、18-24、25-34、35-44、45-54、55+等6個年齡級距,並各自分成男、女兩個類別,總計12個類別,並依據此收集各年齡性別族群對於各媒體的喜好參數,作為第1項輸入數據。其次,透過 DoubleClick Bid Manager 收集個別群體對應於 OneAD 消費者的瀏覽紀錄,經過數據的收集、清洗與整理後,作為第2項輸入數據。
  • 預測消費者年齡性別屬性
    建立深度學習模型後,會將模型儲存下來,接下來系統每天會將個別消費者在過去數天瀏覽網站紀錄,經整理後作為預測模型的輸入,然後執行個別消費者年齡性別屬性預測,預測結果即用來作為廣告投放的年齡性別屬性參考依據。整個系統運作流程如圖3所示。

    消費者年齡性別屬性預測的系統流程
    圖3: 消費者年齡性別屬性預測的系統流程

     

    消費者年齡性別屬性僅僅是消費者輪廓的基本項目,OneAD 為了讓廣告主能多面向了解消費者的興趣與意向,亦透過消費者瀏覽網站的內容,以自然語言處理技術,配合字詞向量演算法 Word2Vec,找出特定興趣相關相近的字詞,進而歸類消費者近期的瀏覽興趣與關注的特定議題,以描繪出更清晰的消費者輪廓,相關的技術細節將另文說明。

1128-1-01-01-01