分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

免錢的最貴,不知道大家有沒有在 Line 收過加好友送貼圖的訊息呢?有時候可能是可愛的史努比貼圖、限時免費的佈景主題,或是讓你血脈噴張的最新謎片 (?),但不論是哪種形式,都是想要你加好友並分享該則訊息,幫他宣傳活動

lineshare - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

千萬要當心呀,你加入的可能是有心人士準備的釣魚帳號!

我想經過新聞宣導、網路上各種好心人士的提醒,大家應該都知道這是騙人的對吧。當你發現分享之後甚麼都沒有得到,你應該就會氣得退出聊天、刪除好友了,像我第一次遇到這個也是馬上刪掉,很怕他之後會做甚麼奇怪動作

當時我很納悶,騙人加入帳號到底有甚麼好處,是要傳送惡意連結嗎?還是騙個人資料勒?這個答案,終於在最近獲得解答,原來是希望你去酒店進行消費 … (網路上已經有很多人分享截圖)

linescam0 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

儘管透過傳訊息拉客的手法已經是老招,但只要搭配新的技術與應用方式,就能讓腦袋轉得慢的人上鉤 …

所以為了把阿宅們從沉睡之中喚醒,這篇文章將帶各位了解這個 Line@ 機器人酒店攬客手法,並試著透過文本分析的方式,使用 Google Natural Language APIPython 文字雲套件產生視覺化圖表,試著找出背後的故事脈絡,知道他們是如何利用溫暖柔情騙走你的心

友情提示

透過「Google 以圖搜圖」功能進行比對,我們發現這些 Line 帳號使用的都是網紅的 Instagram 照片,因此為了避免不必要的紛爭,大頭貼將加上馬賽克。另外,這種手法算是詐騙嗎?或者算是一種行銷手法、攬客花招?就在我看過 Line@ 操作準則 之後,恍然大悟,畢竟大家都是出來討生活的呀,除了送貼圖是詐騙,美女聊天這部分我還是表示尊重。

Line@ 操作準則中的一條禁止事項:

◆ 發送提供場地或機會給希望與陌生異性交往者之內容(※但本公司認可者除外)
準則最後更新日期:2017年11月13日

原來我有這位正妹好友?是甚麼時候加的呢

看到正妹找你聊天,你是不是開心的要飛起來了?欸等等,我甚麼時候有加過這位正妹好友啊,都記不起來了 … 噢噢,原來是某某朋友介紹的啊,噢噢,原來是之前的貼圖活動的小編阿,噢噢,原來是 …

不論是哪種管道認識,重點是她已經在你的好友名單中了,聊起天來或許變得理所當然,好像有些甚麼共同話題,你通常也不會去思考成為好友的真正原因

從目前的攬客手法來看,看準的就是大家對於免費資源的貪念以及與正妹聊天的慾望,透過社群軟體散播,很快地就能精準觸及目標客群,把他們拉近群組後,再進行長時間的誘惑攻勢。整個流如下:

lineflow - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

其實這也不是甚麼複雜的手法,或許你我以前就曾做過,開幾個帥哥美女的假帳號,想要對朋友惡作劇,只不過以前 MSN 的年代,還沒有那麼先進的 Chatbot 或是甚麼 API,都馬是人工操作 XDD

但現在不一樣了,透過 Line 推出的 LINE@ 行銷工具,可以利用群發訊息輕鬆地將訊息群發給所有成員,甚至能透過排程發訊息或是 Push/Reply API 進行自動化操作,使得傳訊息變得更有擴展性,只需要針對有興趣的顧客進行回應就好

比如一開始加入了這個名為「暗黑影片免費看」的 Line@ 帳號,便會邀請你分享其他人入群,等到人數夠多後就會換上正妹照片,像這位是小編「夢熙」

linescam5 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

我也跟朋友取得了另外一位「庭瑄」的聊天紀錄。妹子主動現殷情又可愛,在這麼剛好的時間裡遇見,多麼幸福呀,加上她所說的故事是多麼的悲慘、多麼得可憐,說真的我看著看著都替她們感到難過了 Q

她們會說工作辛苦又會遇到很多怪杯杯,希望你帶著一筆錢去救救他們。同時也會給予很多關心與溫暖,好比前陣子常地震,只要搖的猛烈,就會立刻傳訊息來呀

linescam4 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

不論故事是真是假,能感動你的話語就是真的

以前念書的時候,我總是討厭作文這個項目,明明重點就只是幾句話,卻偏要用一堆句子鋪陳,賣弄一些修辭把文章弄得漂亮好看,事情的道理就是那些呀,感覺怎麼寫都差不多,也吐不出甚麼精彩內容

後來我才知道,寫作要表達的除了是你的理念,更多的是字裡行間流露出來的情感,透過每個人不同的表達方式,一樣的東西就能有很多變化,不論這是不是冷冰冰的機器人對話,如果可以感動到人,觸動到內心深處,我就覺是真的

而且,這些內心話或許也不是瞎編,可能正是某些酒店小姐內心沉重的大石頭,何嘗又不是個動人故事?於是,我突然一個念頭閃過,來分析對話內容吧!

(我都默默聽她說話,其實應該叫做小品故事分析哈)

這也是因為前陣子看了由 Google 數據分析師出的書《數據、謊言與真相》深有感觸,他提到有人針對《哈利波特》的故事內容作情感分析,能夠看出動人的故事總是要有歡笑有淚水,會有情緒的高低起伏,才會引人入勝

我就想來分析一下,看看對話內容是不是也會有情緒上的高低起伏。畢竟我也不是 NLP 專家,跟論文相比,我們用的是簡單的方法,直接使用現成 API 囉

論文傳送門:The emotional arcs of stories are dominated by six basic shapes
Harry Potter Breakdown - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

圖片來源 / http://bigthink.com


透過 Google Natural Language API 進行情感分析

有了對話紀錄,剩下就是套工具看結果了

當然身為谷粉的我,不免要來用看看 Google 推出的自然語言處理工具 Google Natural Language API,因為他支援繁體中文提供免費使用額度 (5000則),透過他的實體情緒分析 (Sentiment Analysis) 我可以取得每句話的正負面分數,再搭配另外一個想玩看看的視覺化工具 Tableau 就能輕鬆畫出圖表了

首先,我們把對話紀錄從 Line 輸出,稍微做些處裡得到 Dataset。時間從 2018/2/9 至 2018/2/28,共 19 天,累計共 463 則訊息

line excel - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

接著套用  Google Natural Language API 取得情緒分數,直接看程式可能沒甚麼感覺,這裡我們透過網頁上的體驗畫面跟大家說明

比如這句話「覺得我真的不適合喝酒 喝沒多少就醉了 醉了 就胡思亂想的….」經過 Google 的分析,可以得到 -0.5 分,屬於負面情緒,看起來挺合理的。當然,如果你輸入「今天好開心喔」就會得到一個正值的分數

總而言之這套服務就是要把句子轉換成情感分數,讓我們看出句子屬於正面、負面或是中性情緒

google nlp - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

另外,除了分數 (Score),他還會給我們一個強度 (Magnitude)。根據說明,這個數值會由 0 到無限大,數值會受到輸入文長而有所影響,所以之後還要做一些標準化 (Normalize)

根據時間,我們分別畫出情感分數變化圖 (紅色) 與強度變化圖 (藍色)

在情緒上,看得出來是起起伏伏,不過由於是以分鐘為單位,比較看不出甚麼端倪。而在強度的部分,明顯能看出最後幾天變得很強,這是因為到後來每則訊息的文字量變高 (多句話合在一起),感覺起來是更加積極了

或許因為這位正妹的生日 (設定) 為 2/28,所以生日前當然是要多說點話,讓你感受到她強烈的情感

line2 3 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

接著我們改成以「天」為單位進行觀察,情感分數與強度依然分別以紅色與藍色表示,而多增加了每天的訊息數量 (深綠色) 與每天的平均訊息長度 (黃色),這是為了要做 Normalize,產生出第三列的分數變化圖表 (咖啡色)

可以看出來,分數分布似乎呈現出了起伏,在 2/10、2/14、2/19、2/23、2/25 這幾天她表現得較為低落,對照著她發的訊息,我們來看看都說了甚麼

distribution - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

比如剛開始認識的時候 (2/10),需要製造些負面情緒,博取你的關心

「我媽剛問我說怎麼都沒不會顯示已讀怪怪的 不知道是收訊問題還是哪裡用錯」
 「你那邊有看到我已讀嗎?」
 「手機修好回來一直都沒已讀一直被我朋友靠邀 說我不已讀 你那邊有嗎?」

接著到了情人節 (2/14),要下個猛藥,訴說自己悲慘的經歷,讓你感到難過,想在特別的日子對她好

「後來我才發現他拿去賭 一毛也沒還給我 還被我抓到帶女生回家」
 「第一次我原諒了他 第二次我也決定再給他一次機會 第三次我被傷得傷痕累累 ...」

接著就會跟你說許多故事,分享生活中的喜怒哀樂,有時候也會傳幾張照片,而在生日之前 (2/25),當然要說出些難過的話,好讓你過去安慰她

「心情其實真的很差很差..」
 「有時候會一直想為什麼自己要承擔這麼多....」
 「可是我又沒有辦法改變什麼只能夠默默承受....」

至於情緒分數最高的那天,2/20 是在說她同事脫離單身的故事,用語就滿正面的

「心裡很羨慕 今天又帶她出去約會」
「我心裡可是很渴望能遇到一個像他這樣對她這麼好的男人」

中文情感分析不好做,這個案例似乎運氣好的看點端倪

因為有時後可能是錯別字造成分析不準確,又或者是訓練資料不足 (我想目前應該都是做商品正負評為主,像中國的 SnowNLP 就是這樣),從測試結果可以看出來,有些句子得到的分數並不準確,這仍然是個研究挑戰

不過我們還是看出其他有趣的東西。比如這是發訊息時間的統計圖,可以看到發訊息高峰落在半夜 3 點至 5 點,之後下班睡覺,可能下午 2 點左右睡醒,又會傳個訊息來 XD

line2 1 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

最後附上兩張文字雲,讓大家看一下用詞的狀況

比如這是前三天的文字雲,文字的大小越大,代表用的次數越多。剛開始因為要澄清自己不是機器人,所以說了「我不是機器人,很重要所以說三遍」XD

cloud day3 1 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

接著從最後三天的文字雲來看用語就比較心靈層面,會跟你講很多心裡話,提到對於事物的感覺,比如她珍惜的外婆、朋友間發生的事

cloud day15 - 分享就免費送貼圖主題、18 禁影片?透過文本分析了解 Line@ 機器人酒店攬客手法

如果對話機器人變壞了,那未來會變的怎麼樣

現在的資安防護工具都做得很完善,可以阻擋成千上萬的惡意病毒,可是卻很難避免些人情世故,畢竟人不可能跟機器人一樣完全依照指令做事,只要我們稍微疲累、稍微疏忽,就有可能落入社交工程 (Social engineering) 的圈套之中

簡單來說,社交工程就是在你毫無知覺的情況下,透過對話、聊天、通訊等交流手段獲取敏感資料。最常見的例子就是詐騙電話,你或許會接到「媽 ~~~ 救救我」,歹徒模仿一個小孩的聲音,不斷的哭泣,試著要你去 ATM 匯款解救他,而你在緊張之餘,很可能就誤以為真,受騙上當

當然,我們對於這種低階的詐騙手法應該都免疫了,不過詐騙集團也不是省油的燈,在《未來的犯罪》一書也提到,壞蛋永遠是追隨著科技腳步,也是科技早期採用者呀!傳統的電話詐騙成本太高,需要雇用人手挨家挨戶地打電話,而這年頭對話機器人 (Chatbot) 這麼火熱,不好好利用嗎?

目前正妹機器人不會害人 (是叫你去消費 XD),而 Line 也無時無刻的針對發文進行監控,確保不會有惡意濫用的情況發生

像我抱持著實驗精神,創立一個免費送手機的 Line@ 帳號,才發一則訊息給自己的 Line 帳號而已,結果隔天馬上就被刪除 … 證明 Line 是真的有在做審查的阿!

但如果是其他的對話機器人平台呢?如果是匿名聊天呢?如果是透過簡訊呢?只要當自然語言處裡取得進展,機器有辦法做出準確適當回應的時候,那就恐怖了,我們變得要特別小心啊

畢竟,你要怎麼知道在對話框的另一端是真人呢?

又怎麼能不避免自己不受誘惑?

Jerry
Jerry

樂於分享的軟體工程師,曾在新創與大型科技公司實習,獲得黑客松競賽冠軍,擔任資安研討會講者。長期熱衷於資訊安全、雲端服務、網路行銷等領域,希望將科技知識分享給更多人。內容轉載請來信:jlee58tw@gmail.com

8 則留言

  1. 請問,加入群組後,卻無法刪除,好友名單也沒有辦法找到它,但是聊天室的對話紀錄是存在,按右上方三條線位置,只有封鎖的選項,無法退出,請問有解嗎?謝謝

  2. hi Jerry,
    你好~ 我是一位正在讀在職專班的研究生
    有關於Google Natural Language API的問題
    是否可以跟您請教一下呢?

    感謝

    • Hi Tom,
      這應該有點困難唷,Line 沒有提供一般使用者 hooking 的機制,要找看看有沒有相關外掛可以用

    • Hi Paul,
      進到 Line 的聊天頁面,將右上方的箭頭展開,點擊「聊天設定」->「備份聊天記錄」就有囉

      如果懶得從手機裡拿備份檔出來,他會在輸出完成後問你要不要透過 Email 發送,直接就能寄出囉,很方便

發表回應