啥是Gadio跨類認親系統?


3樓貓 發佈時間:2024-02-01 19:32:22 作者:YQBelmont賁 Language

上次咱們搞了一個Gadio高維空間定位系統,承蒙各位興趣,本來筆者還在慢慢悠悠佛系研究聚類,突然很有動力東西把這個“認親系統”先上線了。說實話數據在那之後要把前端搞出來工作量也不大。今天不廢話,四件事。
  • 地址與使用說明
  • 背後算法簡述
  • 一些零散的小發現
  • 未來工作

一、地址與使用說明

筆者發現Gadio官方一共分了有20多個類,那如果一個一個配對的話就是。。。應該。。。反正很多就對了。所以最後想到了採取這種拖放的形式,直接把上面的標籤拖下來放到位置就可以了。(這種形式也算還有了點交互)值得注意的是:如果您是移動端的話,需要長按標籤,等到它變成了一個黑塊的時候,再拖放即可。
完事兒,使用說明就這麼多,地址在這

二、算法簡述

也很簡明,首先把2300多期Gadio按官方分類方法分成20多類,然後每個電臺的所有文本求一個平均向量A,再把這一類裡面的所有的文本求一個平均向量B。那麼每期節目都有了一個代表自己特徵的A,每個類別也有了一個代表性向量B。
剩下的就是用A和B之間排列組合比對就好了。用的依然是餘弦距離,結果裡出現的“距離”是數字越小表示相似度越高。

三、一些零散的小發現

這裡的小發現基本就
首先,每個類別內部的結果如下。
平均節目:是距離該類的平均向量距離最近的節目 離譜節目:是距離該類的平均向量距離最遠的節目(注意這個是倒排的,最遠的在最後)
好吧,此處危險,最冒犯的就是“最不Pro的Pro節目”了。(捂臉)不過其實筆者針對這一點也有話說,因為距離平均值最遠,其實只意味著“最不典型”,換句話說叫”出頭鳥“,那麼這個出頭鳥到底是菜的出頭還是鋒芒難掩,還真不一定。
但是該說不說,紅旗下的車輪《第四章》這期節目,比到處第二的距離整整翻了一倍。(而且之前的粗略聚類分析裡,這個節目也總是自己孤獨地被分成一類)如果真的不是程序出錯了,筆者是真的太好奇這期節目裡到底談論了什麼。。。有空一定要去聽一聽。
說到這,就不得不提倒這個“平均”和“離譜”的叫法,非常精彩,不是筆者發明的,是一個B站Up,文末給各位貼上鍊接。他用這一路方法研究了近幾年的流行音樂,然後得到了一個非常情理之中卻意料之外的結果,非常精彩。
然後就是很顯眼的那麼幾個歷史遺留標籤,比如”會員專享“這個標籤只有一期節目。。。還有就是歷史原因分錯類的,比如《魔獸世界故事》有好幾個篇都是分到Pro裡的(這個可以看上方的認親環節結果)不知道這個事情有沒有必要整理一下,雖然都是過去的節目了。而且,關於這個還有一個點充分顯示出了這種向量方法的魯棒性,因為既有的平均向量也是包括了這些分類模糊的節目的,依然還是表現出了相當程度的合理性,還算不錯。如果分類都糾正了或許效果會更好吧。(而且筆者早年間的Pro真的是非常啥都有,又冒犯了,捂臉)

四、未來工作(個人)

還是回去研究聚類了。然後準備把站內文章也研究研究。
另外後面的更新時間不一定啦,感覺過年期間要開始集中搞一下這個建築師的自動化案例研究工具。就這個(心心念念)↓
也是跑個題,這個 (希望)能自動幫助建築師一鍵完成案例研究的工具年後準備來一波內測,誠邀感興趣的同胞私信聯繫~到時候會上線到公網的網址給大家測試一下。關於這個工具的可以參考這個視頻:https://www.gcores.com/videos/176878
大家龍年大吉!!!
附錄:
  • 開源:https://github.com/jlmaoju/Gadio_Vec
  • 上方提到的音樂相似性量化研究(重輕老師也有客串嗷):【關於流行音樂的深度研究:華語音樂已經完蛋了嗎?】

© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com