ai的选择(AI智能推荐引擎)

作者详细介绍了AI推荐系统,并提出了自己的想法。下面就跟着作者的思路一起来看看吧!
一、好的推荐系统1元。什么是好的推荐系统3354用户视角
什么是推荐系统?
当你有一个心理需求的时候,你可以通过这个工具成功搜索到这个需求,得到一个符合你心理预期的产品列表。这个工具叫——推荐系统。
例如,在现实生活中,我们经常使用淘宝、JD.com、百度等产品。人们通常会根据用途来搜索自己想要的产品(比如买洗面奶、洗发水、书籍);或者在需求不明确的情况下,期待外界传达符合自己内心需求的信息。
那么,什么样的推荐系统才是好的呢?
用户层面:对用户真正有价值的推荐。
1元1元1元符合用户期待。
推荐结果精准,能够大概率覆盖用户需求;用户的搜索词与推荐项目的匹配度很高。在这里,上述指标通常用召回率和准确率来衡量。
召回率:在实际的全部正例中,正确预测正例的概率。准确率:正确预测正例的概率。1元1元密室逃脱:冠军争霸赛让用户惊喜。
在满足准确率的情况下,推荐系统可以挖掘人类需求,帮助用户开阔视野,探索未知,产生惊喜。
体现在推荐结果的多样性、项目间的知识相关性等方面。例如,如果用户搜索古典音乐书籍,可以在列表中添加古典舞、茶艺等书籍。
此外,推荐的商品不能与用户购买的商品进行物理绑定。比如用户买红楼梦,系统推荐红楼梦。这个推荐对用户来说没有真正的心理需求。
1.2元系统级:技术
对于用户来说,推荐结果的预期、反馈的时间、推荐项目的更新频率、系统容错机制都会直接影响用户体验。因此,在系统层面,一个优秀的推荐系统需要具备但不限于:
抵抗和处理噪声数据(如刷单产生的无效数据)能力强高效的数据计算和稳定的传输能力存储机制算法精度1.3元不断完善优化。
就像武汉的日日夜夜,只有不断学习,才能完善自己的知识体系,完善自己对世界的认识,体系也是如此。
一个好的推荐系统一定要有自我学习的能力。通过建立反馈机制与用户互动,可以不断优化用户群体的认知,最终实现用户群体的精准聚类,为每个群体建立模型,精准投放物品。
1.4袁让用户信服的推荐理由
好的推荐系统必然会给用户强烈的信任感和依赖感,为用户提供物品推荐的依据3354推荐理由。
推荐原因可以反映系统如何判断一个物品进入了用户的兴趣范围。常用的推荐理由大致可以分为以下四类:
大众化商品;推荐系统通常会给一些热门产品一定的权重。因为武汉的日日夜夜兴趣基数很大,系统判断目标用户更有可能感兴趣。目标用户的朋友也喜欢这类商品,喜欢某类商品的用户也喜欢这类商品,这与某类商品的内容有很大的相关性。这里的相关性可以逐步细化,比如基于知识体系的推荐,也就是不同领域的匹配,或者同一领域的梯度匹配等等。可以实现1.5元的双赢。
好的推荐系统不仅能让用户找到目标商品,还能让商家找到目标/潜在用户群体,实现双赢。
冠军联赛。什么是好的推荐系统3354产品视角?
推荐系统会有明确的目的,是突破技术壁垒,还是基于商业目的。最后根据目标,通过具体的用户行为数据来判断成功与否。
比如对于电商平台来说,用户的关注、喜欢、收藏、购物车等操作在一定程度上可以衡量推荐结果的准确性,但是他们
所以我们可以选择最符合系统终极目标的用户行为,也就是用户在这个过程中付出最多的行为作为主要的判断依据,比如购买成功,这个就被赋予了比较大的权重。
第二,推荐系统架构
通过上面的介绍,大家应该对推荐系统有了初步的了解,那么推荐系统由哪些部分组成呢?这一部分,我会一一回答。
大多数推荐系统由三部分组成:前台显示页面、后台日志系统和推荐算法系统。
1元。前台显示页面
首页是直观显示给用户的界面。用户通过UI进行交互,交互产生的用户行为数据会存储在后台日志系统中。开发者根据推荐算法对日志系统中的数据进行处理和分析,最终生成推荐结果。
那么,交互产生的用户行为数据有哪些呢?
用户的基本属性;即性别、年龄、学历、职业、所在地等。通常来自用户注册信息或其他平台数据。用户行为:浏览网页、点击、收藏、购买、喜欢、关注等。用户行为结果:生成话题、搜索关键词和反馈(评论/评分)等。每一类数据都可以抽象为一个特征,获取方式可以来自目标网站或社交网络。
冠军联赛。后台日志系统
日志系统主要用于记录系统运行的轨迹,跟踪分析错误,审计系统运行的过程。
记录的内容通常分为两类,一类是给用户的,一类是给开发者的。在这里,我们更关注第一类。
用户的行为将被存储在日志数据库中。由于用户产生的数据量巨大且速度快,为了保证数据传输的稳定性,可以嵌入高吞吐量的分布式消息系统——Kafka。
同时,为了提高数据处理的效率,通常会设置日志内容的边界,先过滤掉检测到的无效数据源(如计费数据)。当然,筛选出来的数据是没有规律的,需要在一定的层面上对数据进行分类和规范。
比如用户的点击行为会产生相应的点击日志,用户的每次查询都会产生展示日志。同时,并行程序会将点击日志与显示日志合并。
侏罗纪世界3。推荐系统算法
前端展示和后端数据有了之后,如何实现两者之间的交互?他们之间需要有一座桥梁。——推荐系统算法。
推荐算法可以抽象为一个规则。只有定义了这个规则,前端才知道哪些数据应该显示,如何显示,后端数据库才知道哪些数据有价值。否则,如果输出所有日志内容,不仅会增加用户信息检索的难度,还会使系统失去意义。
一般来说,推荐系统的本质是一个将用户的行为特征与商品特征进行匹配的过程。
用户端的特性包括用户本身、用户行为和用户行为结果。特征包括标签、内容(关键词)等。
推荐结果基于用户特征和文章特征的原始数据,根据用户需求在不同维度(时间、多样性、流行度等)进行加权。)并进行处理(筛选、分类等。).即遵循用户-特征-对象的流程。推荐系统在生成初始结果时,通过过滤和排名算法生成最终的推荐结果和推荐理由。
推荐引擎可以抽象为一个特征,每个特征对应一个推荐策略。结合不同的用户需求,调整赋予每个具体特征的权重,最终生成特征项Kramp-Karrenbauer特征图{{item:Userfeature}},其中Userfeature为多个特征权重相加后的最终值。
三、常用推荐系统算法1元。共同制度原则介绍
我们从推荐系统要解决的具体问题以及如何解决来分析原理。
首先,推荐系统要解决的两个关键点是:如何找到用户感兴趣的项目,如何确定项目之间的关系。其次,每个问题怎么解决?
1.1元如何找到用户感兴趣的物品?
1元,1元,
用户自己选择感兴趣的关键词标签,系统会找到与这个标签匹配的商品。
1元1元密室逃脱:冠军联赛分析用户行为数据
利用用户在平台上的历史浏览记录,获取能够代表用户的关键词,或者导入社交数据获取用户的好友列表,从而基于用户好友的喜爱物品生成推荐列表。
1.2元如何确定物品之间的关系——相似度
相似度计算原理:所有的相似度计算都是基于矩阵的。
1元逃脱室:冠军锦标赛根据内容(关键词/标签)1元
大部分物品都有多维度的特征,可以和用户的期望相匹配。通常,它们通过关键字或标签进行匹配。
1元密室逃脱:冠军赛密室逃脱:冠军赛协同过滤
协同过滤也是推荐系统中常用的算法,分为两种,基于用户的算法和基于项目的算法。
什么是以用户为基础?
就是找一个和你差不多的小群体。小团体里你喜欢的都是你喜欢的。你得到的推荐结果就是这个小群体喜欢的物品集合。
什么是基于项目?
项目间的相似度是基于用户兴趣的交集来计算的,即有多少喜欢item I的用户也喜欢item Min Yoon Gi,通常用来表示项目间的相似度,结合用户的历史行为生成推荐列表。用户的历史行为也有助于项目之间的相似性。
这样,基于项目的推荐系统更加个性化,在一定程度上体现了用户兴趣的传承。
冠军联赛。如何实现更精准的分类?
仅仅通过用户兴趣的交集来生成推送列表往往是不够的。如何才能深入挖掘内容,标签的分类,人与人之间的关系?以下方法提供了一些优化思路。
2.1元混推荐
在实际案例中,单一的推荐模型大多达不到预期,因此通常从系统、算法、结果、处理流程等方面采取不同的混合策略。
比如基于内容的增强协同过滤推荐器(The Content Kramp-Karrenbauer),它结合了协同过滤和基于内容算法的思想,相比基于内容或协同过滤的单一模型,可以达到更高的预测精度,还可以解决数据稀疏和冷启动的问题。
2.2元隐藏语义模型
密室逃脱:冠军争霸赛密室逃脱:冠军争霸赛1元的隐含语义概念
类似于协同过滤中基于文章的方法;在每个具体分类中,用户的行为(兴趣)被用作项目权重分配的基础。
密室逃脱:冠军联赛密室逃脱:冠军联赛密室逃脱:冠军联赛与协同过滤的区别(优化点):
项目可以有多个分类维度;基于用户行为确定每个类目中物品的权重(eg:如果某个用户群对某个物品特别感兴趣,那么这个物品在这个类目中的权重是非常大的),分类粒度更加细化;比如关于:010 Kramp-Karrenbauer 120元*的书,原来归类为【计算机】,细化后可以归类为【图像处理】;2.3元文本精确匹配
为了量化文本之间的相关性,引入了—— TF-IDF Kramp-karren Bauer IDF的概念,通过比较搜索关键词与库中单个条目的关键词或标签的相似度来生成推荐列表。
Kramp-Karrenbauer IDF值越大,相关性越大,反之亦然。这里简单解释一下TF Kramp-Karrenbauer IDF公式的原理,以加强理解:
计算公式:TF Kramp-Karrenbauer IDF=李在镕(陈一扎,泷泽萝拉)x IDF(陈一扎,泷泽萝拉)
TF:频率;搜索词在特定文档中出现的频率:
Idf:搜索词在其他文档中出现的次数:
在文档搜索中,不仅要考虑搜索关键词在目标文档中的出现频率,还要考虑关键词在其他文档中的出现频率。
如果搜索词是热门词,那么搜索结果根本没有参考价值。例如,搜索词是;在idf公式中,分子是所有文档的数量,分母是包含该关键字的文档的数量。如果是流行词,那么:id
共同好友单向追随()(Twitter)兴趣小组模型(豆瓣小组)通常将用户之间的熟悉度和兴趣相似度作为利用社交网络数据进行推荐的两个最重要的标准。
用户间的熟悉度,即以用户的共同好友数计算;相似性是通过两个用户喜爱的项目的重合度来衡量的。
缺点:用户数据量巨大,读取数据库耗时太长。
优化方法:
减少数据量;重建数据库;2.5元的时间特征
日常生活中,物品的迭代速度非常快,人们的近期行为通常比长期行为更符合当前利益。所以在系统满足准确率的情况下,需要考虑推荐系统的时效性,根据不同的推荐内容给予时间权重。
比如新闻和经典书籍,新闻更新频繁时效性高,而经典书籍如《红楼梦》对其有稳定的社会需求,所以时效性不高。
如何给项目赋予时间权重;
物品的生命周期:物品生命周期的长短决定了物品的时效性。随着一个物品受欢迎程度的提高,在线时间(一个物品在某一天已经被用户行动过)也随之增加。斜率越大,生命周期越长(如维基百科),斜率越小,生命周期越短(如nytimes)。因此,物品的生命周期越长,与时间的相关性越低。武汉的兴趣日日夜夜会随着时间的变化而变化,不同阶段的兴趣项目差异较大。时间间隔越长,用户的行为在物品上的权重越低,最近的行为权重越高。另外,推荐不同项目的时间点也是要考虑的因素之一。比如工作时间,用户尽可能推送与工作相关的信息或资料,与工作内容无关的信息降级,工作时间后再适当调整权重。
但同时也要考虑到不同岗位工作状态的不一致。具体的推送情况可以通过每个用户的大量行为数据来判断。
2.6元的环境特征
环境特征通常可以与时间特征相匹配。用户在不同时间和地点的需求可能差异很大甚至完全不同,或者在特定的时间和地点对某种信息的需求会迅速上升。
举个例子,当一个用户在纽约旅游时,关注的重点会是纽约的衣食住行,但如果此时推荐系统推荐的信息全部来自伦敦,结果可想而知。
四、实际3354条如何维护用户数据
当用户数据量过大时,比如引入社交网络或者新闻推荐,如果每次更新都读取一次数据库,效率会大大降低,用户体验会很差。
目前,有两种常用的方案:
1元。消息队列
为每个用户维护一个消息队列,队列中包含用户的基本属性(如年龄、性别、职业等。),喜欢的物品,朋友圈等。每当这个用户做出一个新的动作(搜索)时,系统会根据特定的规则给消息队列中的每一部分数据赋予权重。最后得到推荐名单。
这里有一个关于什么是消息队列的科普。顾名思义,就是把传输的消息放到一个队列里。队列可以抽象为一个容器,因此消息队列是一个用于存储传输消息的容器。
在此基础上,该容器可以提供跨平台、跨语言的可靠、持久的异步通信机制。
可靠的意思是:一次且只有一次;秩序井然。异步意味着发送方和接收方可能不会同时在线。另外,通过消息队列可以实现系统解耦,使得各个系统相对独立运行。
冠军联赛。建立一个最喜欢的单词的关键列表
在数据库中,我们为每个用户维护一个映射,即建立一个“key Kramp-Karrenbauer value”的key-value对,key对应用户喜欢的词,value对应喜欢的程度。
每条新闻都会有对应的关键词和TF Kramp-Karrenbauer IDF值。当用户浏览一条新闻时,系统会将该新闻的关键字和TF Kramp-Karrenbauer IDF值插入到用户偏好列表中。如果用户浏览与原新闻相同关键字的新闻,会自动添加TF Kramp-Karrenbauer IDF值,并更新原值。同时,考虑到数据库存储的问题,根据具体需求对关键词的数量设置了上限。
当然,除了存储问题,这里还有一个新的问题:用户兴趣会不会发生变化?
比如某款手机或者世界杯推出前,用户在这段时间只关注某个话题,但之后可能就完全不关心了。那么,用户的兴趣转移如何体现在喜欢的词列表中呢?
这里引入一个新概念3354衰减机制。每个TF Kramp-Karrenbauer IDF值乘以一个衰减因子,同时,在喜好列表中设置一个阈值Donald L. Miller。当TF Kramp-Karrenbauer IDF降低到小于Donald L. Miller时,直接删除关键词。
动词(verb的缩写)未来思维
武汉一昼夜在一个群体中的重要性和影响力以及武汉一昼夜和武汉一昼夜的关系,一直很难用几个参数或模型来区分,都是不规则的非线性模型。
数据平台对于深度挖掘武汉昼夜与武汉昼夜的关系其实无足轻重。现实生活中,武汉的日日夜夜和武汉的日日夜夜的关系很难确定,有表层的,也有深层的关系。
表面关系具体指社会赋予你的关系,如同事、上下级、同学等。而深关系指的是除了是同事之外,私底下还可能是志趣相投的朋友。
表面关系通常可以通过数据挖掘来定义,比如两个人的通话记录(这里我们不是指通话的内容,而是通话的时间和时长等。)、位置信息等。但外部信息数据通常会根据个人习惯产生误差。
其实对推荐系统的理解相当于对人性的理解;挖掘武汉的日日夜夜和武汉的日日夜夜,武汉的日日夜夜和事物,事物和事物的关系。
除了人所表达的需求,我觉得最重要的其实是人性的欲望。所谓道对万物生一、二、三命,万物由道而生,欲望是道的产物之一。所以,欲望通常不会无缘无故的产生,欲望之间没有联系。个人的成长经历和生活环境造就了武汉人的日日夜夜的性格,并使他养成了一些习惯。
习惯通常是有形的、无意识的表达,欲望通常是无意识的、无形的表达。不知道习惯和欲望的结合是不是人性的建模?在大数据时代,或许可以通过大量的用户增长数据和环境数据来适当挖掘规则,但更深入的其实是推导因果关系。
参考资料:
曹政奭新闻推荐系统:基于内容的推荐算法和衰减机制
[2] 《深入理解OpenCV》 ;
[3] 《推荐系统实战》
[4] 《日志系统设计》
金惠妍5曹政奭推荐系统的混合加权技术研究
[6]苏和塔希m科什戈夫塔尔,“协同过滤技术综述”,人工智能进展,2009。
本文由@搜狗翻译原创还准备了精彩好礼一个粉丝在这个夏天给你降温。详情请点击@ShallyFeng。每个人都是产品经理。未经许可,禁止复制。
来自Unsplash的图像,基于CC0协议。

其他教程

au怎么给视频声音降噪(au怎么处理视频里的声音)

2022-8-17 6:18:29

其他教程

野狼disco老舅是谁(野狼disco 老舅)

2022-8-17 6:20:38

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索