通过研究微信文章的相关推荐逻辑 ,尝试生成指南| 代码实验

hi~我是shadow,很多时候我也不知道实验过程中会发生什么,也许什么都没探索出来(最起码凑了一篇文章)。只是为了验证心中所想。

今天分享下使用代码生成指南的实验,主要的流程:

1 /
自动下载文章,并收集相关推荐。
2 /
自动生成指南,重新写了排版样式,图片加入了自动裁切。
3 /
可视化分析。主要通过echart实现可视化,用了官方的示例。

echart的官方示例

💡 实验过程

使用了mixlab发过的2篇文章作为种子,循环获取相关推荐,得到几十篇相关文章,第一个直观的感受就是,推荐的文章之间的主题相关性非常高,同一个号的文章会集中推荐。

种子文章,相关推荐情况
如上图所示,同样色的为同一个号的文章,连线表示相关推荐关系,节点的大小表示被推荐次数。对文章进行关键词提取,选取权重最大的代表文章(如下图所示),知识点之间的关联度很高,有部分信息孤岛现象。
知识的关系

记录下,实验过程中产生的一个想法:借助推荐算法,把相关联的文章整理出来,可以手动进行一些编辑和处理,最后形成一个指南,指南的构成


1 种子文章
2 关键词云
3 扩展阅读材料
指南初稿:
1

awesome-design.ai 智能设计

一起打磨最适合设计黑客的智能设计指南

ENJOY
2

一人企业+超级CMS,属于设计/技术创作者的美好时代

新商业模式

ENJOY
3

深度学习的“瓶颈”与“遛狗”定理

深度学习的社会学瓶颈可以用生成模型来解决;算法瓶颈中的模式坍塌问题可以归结为最优传输映射的非连续性;而“遛狗”定理给出了最优传输映射的非连续性的一个充分条件。

ENJOY
4

全凭“脚感”,这个不看路的机器人就能稳稳爬楼梯,一脚踩空也不怕

来自俄亥俄州立大学

ENJOY
5

不是所有图像都值16x16个词,清华与华为提出动态ViT

动态ViT提高计算效率

ENJOY
6

一文看懂深度学习模型压缩和加速

从算法层到框架层、硬件层

ENJOY
7

你为什么获得不了图灵奖,原来本科学的是计算机专业,数据显示历届图灵奖得主当中竟然只有三位在本科时主修计算机专业......

ENJOY
8

聊聊身边的嵌入式,价格不菲的运动手表

不知从什么时候开始,跑步变得流行起来

ENJOY
9

深度学习下的点击率预测:交互与建模

点击率预测

ENJOY
10

下楼成功率100%!这个“盲人”机器人无需传感器,全凭“感觉”,也能上下楼梯自如

机器人内卷严重,“盲”也要比…

ENJOY
11

11 种数据降维算法,代码已开源!

分享个 GitHub 项目,整理了使用 Python 实现的 11 种经典的数据抽取(数据降维)算法,包括:PCA 等,并附有相关资料、展示效果。非常适合机器学习初学者

ENJOY

实验过程中,还收集了一个视频灵感:

*待续

(0)

相关推荐