当前位置:主页 > 闲鱼技术 >

闲鱼标签怎样设置才能提高曝光量

发布时间:2022-01-26 10:39   浏览次数:次   作者:admin

环境和面临的问题
-"蜜饯M39M39"——"科学清单?"我不知道你们能不能看得出来,但是在闲鱼,这种对话是家常便饭。根据统计,大约30%的闲鱼使用者在25周岁以下。了解95后群体的喜好,对于未来的新老客户提供优质的服务和精准的经营管理非常有帮助。所以,我们期望通过数据挖掘来标记使用者的喜好,建立一个符合闲鱼特点的兴趣标记系统,从而为其精细管理,提升其活动和忠诚。与产品结构化的资讯比较,兴趣的表现方式更具弹性。它的应用范围不受任何约束,可以是一种非常狭隘的类型,比如抽盲盒、徒手攀爬;也可以是一种比较广泛的类型,比如复古或者黑暗。所以,如何有效、准确地了解使用者是当前利益标记建构面临的最大难题。
思想
在建立兴趣标记的早期阶段,我们对三个关键问题进行了分析:
灵活的表达兴趣:不局限于结构化的表现形式,其喜好可以跨越用户工作、学习等多种情景,涉及到生活、饮食、生活等方方面面,单纯用品牌、行业等结构化的词语很难以形容。
研究结果表明:在闲鱼的兴趣范围中,尽管其表现形式多种多样,但其表现形式却是独一无二的。比如 JK系列、盲盒系列等,都是以专业术语为主,独有的“圈”和“爱好”字词,基本不会有任何的含糊。
鉴于闲鱼的用户群体是从0到1的实践,迫切需要建立一个有效的标识系统,而我们的建设方法需要迅速有效,并且能够批量的进行。
本文根据上述三点考虑,对行业中常用的标识系统制造模式进行了调查研究。行业中常用的标记制造方法主要有:1)模式的预报和2)行为统计学。模式预报方法是建立一个基于机器学习的模型,它可以对特定的利益进行预测和评分,分数越高,兴趣就会越大,一般可以分成有监控和没有监控。这种算法具有较高的精确度,但其不足之处在于需要大量的样品,而且通常采取二次分类法,以确保精确度,每个研究对象都需要采集大量的样品,单独建立一个不同的模式,既浪费时间又浪费时间。行为统计学是根据使用者对个人的兴趣行为进行统计学评分,一般考虑行为类型、行为频次、行为时长等,且分数愈高,则对行为感兴趣程度愈高。这种方法计算简单,解释性好,但是因为它没有普遍的普遍性和自学习性,所以在进行统计的时候要兼顾到它的覆盖性和时间性。本文通过比较行业的设计,并根据自己的行业特征,选择了基于行为统计学的方法,并具有个性化的个性化标签设计功能。对于大多数可以被单独描绘的区域,我们会根据自己感兴趣的区域中的关键字进行搜索,从而发现与这些关键字有交互作用的使用者。针对某些不能精确检索到的关键字,我们会进行个人化构建。
解答
利益标记系统
上面是一个完整的利益标记系统。主要工作流是根据网站上的文字和文字资料进行文字分类,并将其与经营伙伴所提供的关键字进行文字比对,并将相关的相关产品或服务对象唤起。然后根据使用者对产品和服务的表现进行统计,得出消费者对该区域的感兴趣度,并将其归类为感兴趣群体。在使用关键字检索时,针对某些无法列举、缺乏业内相关知识的案例,本文采用了关键字关联来弥补。由于这个“圈”的文化倾向于宣扬自己的性格,大多数95后的爱好都可以用一个有着独特含义的关键字来形容。所以,对使用者的利益的了解就变成了两个问题:
怎样从关键字中唤起对感兴趣的群体
怎样选择适当的关键字
怎样从关键字中唤起对感兴趣的群体
在选择前期,我们和闲鱼的技术人员商量出了两个解决办法:第一个是通过对用户和关键字的相关数据进行分析,然后把这些数据输入到网络上,从而达到了网上或者线下搜索的目的。该方法具有良好的弹性和伸缩性,但是也有一些模糊不清的问题。举例来说,我在寻找“古董照相”的使用者时,会发现“复古照相”会被分成“复制品”和“照相”来进行回收,这样就会导致“复式唇膏”和“日本照相”被回收,从而会对“旧”和“日本照相”的消费者造成影响。另外,海量的用户-关键字相关的信息流数量庞大,将极大地降低搜索的速度。鉴于前期主要经营的是长尾巴利益的区域,本文对实施模式进行了修改。第二个解决办法:把使用者、物品和关键字联系起来。悠鱼的平台在经历了这么多年的发展之后,已经积累了大量的用户行为。我们先将相应的商品与关键字进行比对,将其与商品标题、描述等文本信息相结合,将商品的组合表现为感兴趣的内容。其次,对使用者在产品回收过程中的行为(如浏览、收藏、互动、交易等)进行权重计算,得出使用者与产品行为的行为等级。因为感兴趣标记是一个长期的标记,所以在离线的时候,可以将标记好的信息输入到线上平台,然后利用闲鱼强大的人群运营平台和精准投放链路,实现最终的人群精准运营。从原理上讲,使用者对产品的全部使用者-物品的行为分数相加,就是使用者-利益分数。不过,当我们收集兴趣的时候,我们想要将他们的喜好也考虑进去,因为他们的兴趣范围比较大,所以他们的兴趣爱好比较集中,而且他们的兴趣爱好比较多,而且喜欢的东西比较多,这样的人在他们的排名中排名很高的话,就会影响到他们的爱好。我们建立的一个很大的目的,就是要吸引那些有长期尾巴的人,让他们在自己的网站上找到符合自己口味的人,从而提高他们的长期粉丝数量。因此,利用TF-IDF方法,对用户-感兴趣评分进行了分析,并利用TF-IDF方法来衡量这个兴趣区域对于使用者的重要性。
根据关键字和使用者的习惯来计算使用者-利益分数
TF-IDF是一种用于统计文字对文章重要性的文字抽取的方法。它的基本原理是:当一个字在一本书中频繁地出现,而在其它的一些地方却很少见,那么这个字就可以很好地标示出你的话题,而且很容易辨别。实际上,TF-IDF就是 TF* IDF。
反映了单个文档中词汇的出现次数;
反映出这个字在一个文档中的分类识别的功能。
文字在同一文档中的使用次数愈多,而文档中所含文字的档案数目愈小,则文字的文字分类功能愈好,能够反映档案的文字内容。在此,我们把一个感兴趣的区域看作是一个字,一个是一个文件,一个是一个完整的用户,一个是一个文档。
这样,我们就能把那些具有特定爱好的人,作为他们的利益群体。
怎样选择适当的关键字
对感兴趣区域的关键词进行了甄别,以“经典词+搜索词”为主。典型的关键字是以商业学员的经营经历为基础,通常包括了一些最能代表行业文化的词语,比如古典的汉服,比如初级的。我们可以用这些关键字来唤起基本的行动群体。但是95后的追求改变的个性让这个兴趣圈的寿命很短暂,更新也很迅速。为了解决这一问题,我们用基本人口为基准,统计出了该群体最近的热门词汇,并将其列为关键字,从而确保了该群体的时间和数量。
“经典关键词+搜索词”搜索区域关键字
下面的图片为 JK群体的关键字回收,从里到外依次为“标记-中心词-热搜词”。
JK标记的关键字
在比较广泛的范围内,例如:植物、动物等,我们想要在更多的区域内开展业务。但因为涉及的领域实在太广了,所以他的商业伙伴们并不能囊括每一个行业。在此基础上,我们采用了一个完整的分类系统,将不同种类的树叶分类(比如,在宠物分类中,又分为猫、狗、鱼类、仓鼠等,在不同的分类中,再加上多肉,盆栽等不同的树叶类型),并根据不同的类别,寻找不同的分类,形成不同的分类。下面是一张详细的地图,从里到里依次是“树叶分类——分类——分类——分类——分类——分类——分类——分类——”
关键词:宠物标记
也有些是难以用一个词来精确地描绘的感兴趣的区域。就拿复古的怀旧感来说,喜欢这个爱好的人,基本上都喜欢“复古”这个抽象的风格,所涉及的产品和服务,通常都会涉及到化妆品,服饰,绘画,摄影,甚至收藏。在此基础上,我们还根据相关的关键字,将与其有关的词语重新组合在一起,形成文字的搭配以及使用者的记忆。
运用效应
当前,商标系统已基本建成。第一个时期是以95后为主要爱好的行业为研究对象,其结果是:
20多个标记,精确涵盖95后的爱好,如 JK, Lolita,汉服,二次元等
95后人群中50%以上的人都有了“感”的标识,这就为企业的经营管理带来了充足的基础
在覆盖范围上,标记系统也在真实商业中取得了推广的成效,检验了用户的正确性。通过第一阶段的开发,我们将标记系统引入到闲鱼的直播服务中,从而达到了实实在在的效果:
与以前的预设内容显示相比,感兴趣群体与感兴趣区域的直播相结合,点击率呈几何倍数增长,大大提高了推广的效果
因为关注类的直播平台在首页的曝光和点击量的增长,使得那些有兴趣的长尾巴的直播平台得到了更多的关注,极大地提高了他们的工作热情。
将来的计划
因为项目的进度很紧迫,所以根据企业的要求,我们的“利益”标记系统已经完成了初步的设计,并在以后的发展中逐步的得到改进。
基于已有的关键词发现,改进了对关键词的提取,可以实现对区域中的关键字的自动搜索,提高了对群体检索的有效性
加入了语义矢量表达,提高了检索结果的精确度和覆盖面
在已有的行为资讯的前提下,在社区、本地化、娱乐等场合中,加入用户的活动,以更丰富、更完整的用户表现。