点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:字节跳动“青少年模式”——基于机器学习的个性化内容挖掘模型
首页> 网安频道 > 正文

字节跳动“青少年模式”——基于机器学习的个性化内容挖掘模型

来源:光明网2022-06-20 14:01

  关于案例背景

  《2021中国移动互联网年度大报告》显示,短视频使用时长已反超即时通讯,成为占据人们网络时间最长的领域,增长势头迅猛。截至2021年12月,短视频用户黏性超过其他行业,同比增长4.7%,使用总时长占比达25.7%。然而短视频质量参差不齐,对用户造成了极大的困扰。一些优质的短视频,未经允许被“搬运工”和“剪刀手”稍作处理,成为吸引流量的工具;同一内容的短视频被“掐头去尾”,重复出现在不同平台,不仅令观众纳闷,更令视频原创作者烦恼,大大制约了短视频行业的创作环境。短视频的发展短板令人担忧。

  随着在短视频平台活跃的青少年用户日益增加,抖音青少年项目从内容挖掘和智能推荐等多维度应用人工智能技术赋能业务,更好地服务青少年用户。抖音一直以来致力于响应联合国儿童基金会保护儿童的九大原则,从制度制定、技术开发等多侧不断强化未成年人保护。抖音“青少年模式”自上线以来,多次升级系统功能和打磨内容品质,于2021年9月17日针对14岁以下和14-18岁实名用户两个群体正式全面开启平台最严格青少年模式,成为国内各大视频平台中首家推出如此严格保护措施的平台。

  本案例主要分享了抖音青少年项目如何应用机器学习技术,为广大青少年用户创建多样丰富、寓教于乐的内容消费环境。机器学习在抖音青少年项目中主要应用在以下场景中:

  首先,内容挖掘模型赋能内容生态建设,丰富内容供给:青少年模式前期主要依靠运营人工检索挖掘账号丰富内容供给,为高效扩充青少年模式的内容池,我们引入机器学习内容挖掘模型,通过人工智能技术在抖音全局挖掘适合青少年观看的内容,补充青少年模式内容供给,优化、丰富内容供给生态,为青少年提供更加多样的视频内容。

  其次,机器学习模型赋能适龄内容发掘,提升青少年使用体验:在用户调研访谈中,我们发现不同学段的青少年需求有明显差异,为针对性提升青少年内容消费体验,我们在推荐系统中增加了用户侧和内容侧的特征,提升个性化推荐效果,向不同年龄段的青少年推荐适龄内容,满足青少年用户多样的内容消费偏好和对内容的个性化需求。

  关于技术方案的具体措施

  儿童获取信息、学习知识技能的方式也越来越多样化,而机器学习便可以成为为儿童学习与教育服务的重要技术。大数据时代的机器学习更强调“学习本身是手段"机器学习成为一种支持和服务技术。

  特征工程,其实是将数据属性转换为数据特征的过程,对数据进行预处理的话,算法模型能够减少受到噪声的干扰,这样能够更好的找出趋势。在内容挖掘模型中采用了图像特征、语音特征、文本特征,并且对这些特征进一步分析,选择出作者维度特征、画风模型特征、互动维度特征、内容理解特征、文本长度特征。在机器学习模型中采用了基于视频分龄的内容侧特征和基于用户类型、学段的用户侧特征。这项技术有利于对儿童学习需求进行更加精确的侧写,帮助儿童从多感官更好地认识世界。

  互联网挖掘技术,是面对互联网上海量、分布、动态、异质、复杂、非结构化的丰富信息资源,用户如何从中查找、抽取自己想要的数据和有用信息而由此产生。可分为三类:互联网内容挖掘、互联网结构挖掘和互联网应用挖掘。内容挖掘可以抽取对儿童认知有益的、健康的、有学习意义的信息。

  内容挖掘模型赋能内容生态建设,该模型流程图如图1所示。内容挖掘模型的训练主要分为,训练集的选取、模型训练、输出结果策略三个部分。

字节跳动“青少年模式”——基于机器学习的个性化内容挖掘模型

图1 内容挖掘模型流程图

  机器学习模型赋能适龄内容发掘,图2展示了该推荐系统流程图。机器学习模型的训练主要分为筛选视频、读取数据、计算视频得分、返回结果四部分。

字节跳动“青少年模式”——基于机器学习的个性化内容挖掘模型

图2推荐系统流程图

  推荐模型中加入青少年用户类型、青少年用户具体年龄段、内容的匹配年龄分段的特征维度,提升推荐系统个性化推荐能力和准确性,为青少年用户推荐更符合其个性化偏好的内容,帮助青少年更好地学习和成长。

  关于应用效果

  目前青少年模式内容池已有丰富优质内容,内容挖掘模型已为青少年内容池贡献了21%的内容供给量级,并将持续丰富特征、优化模型为青少年模式输入内容、丰富青少年内容生态。其中,内容分龄模型已训练完成(准确率90%以上)并上线,当前推荐算法会结合用户类型、学段和内容分龄进行推荐分发,为青少年提供更加个性化、多元化和适龄的消费体验。

  本产品也面临着很多挑战,一是系统化和自动化的歧视和因偏差产生的排斥;二是基于人工智能的预测分析和侧写对儿童机会和发展的限制;三是基于人工智能的系统也被用于侧写。这些技术大多数受商业利益驱动,会限制儿童的世界观、上网体验和知识水平,从而影响儿童的表达权和言论自由。最终,当儿童在持续的监视下成长,他们的能动性和自主性受到人工智能系统的限制,他们的幸福感和充分发展的潜力将受到限制。

  (案例报送单位来自北京微播视界科技有限公司,上文为部分节选,如需全文请联系项目组。)

[ 责编:姚坤森 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 欣欣,你在哪里——缅甸地震中国力量救援纪实

  • 现场视频!解放军台岛周边开展联合演训

独家策划

推荐阅读
2025年4月1日,船舶航行在安徽省合肥市庐江县境内的引江济淮航道上,标志着菜子湖湿地候鸟越冬季禁航结束,菜(子湖)巢(湖)线恢复通航
2025-04-01 15:40
2025年3月31日,江苏苏州吴中区光福镇,太湖之滨,桃花、樱花、油菜花等竞相绽放,生态优美,春景如画
2025-04-01 15:31
用镜头记录城市更新 青岛首届“百家媒体看改变”活动圆满闭幕
2025-03-20 10:14
"昭君杯"首届全国老年合唱大赛在北京国家大剧院正式启动
2025-03-19 16:10
2025年2月25日,云南省昭通市绥江县,新市金沙江特大桥施工现场,工人正加紧施工。
2025-02-26 15:41
2025年2月7日,重庆市巫山县曲尺乡月明村一大片梅花竞相开放、灿若红霞,游客和市民前来游玩打卡,尽享春日的快乐和惬意
2025-02-08 14:52
2025年2月5日,福建省福清市石竹山风景区,一场非遗英歌舞、建瓯挑幡等非遗表演正在进行,让游客感受中华优秀传统文化魅力,丰富景区文化内涵和游览品质
2025-02-06 15:55
2025年1月20日,江西省赣州市章贡区城市中央公园内,游船与湖水、植被、高楼相互映衬,呈现出一幅冬日多彩美丽生态画卷
2025-01-20 15:30
2025年1月16日,受低温天气影响,山西省运城盐湖出现冬季独特的“硝花”景观,水面上的硝花形态各异晶莹剔透,美不胜收。
2025-01-16 15:56
一位“行者”行走在广袤的沙漠中,遮掩着绝世的面庞,一面“古镜”掩埋于厚重的沙下,刻满了时间的裂痕。
2025-01-13 17:25
2025年1月9日,重庆市酉阳土家族苗族自治县桃花源国家森林公园白雪皑皑,雪景如画
2025-01-09 15:24
关爱卡寒假公益行 助力云南各族青少年儿童梦想起航
2025-01-08 14:42
2025年1月5日,在山西太原南站开往呼和浩特东站的D4022次列车前,游客自拍合影。
2025-01-06 16:01
2024年12月8日,广西梧州岑溪市岑城镇木榔村,生态田园中阡陌纵横线条分明,冬韵如画。
2024-12-10 16:48
2024年12月10日,贵州省黔西市绿化白族彝族乡大海子村,青山环绕树木葱茏,构成一幅美丽的生态画卷。
2024-12-10 16:40
2024年12月6日,古城苏州街头,成片的银杏、红枫等树木色彩斑斓满目缤纷,成为一道迷人的风景。
2024-12-06 15:48
2024年12月6日,初冬时节,山东省青岛市即墨区灵山街道花卉种植基地的大棚里一片繁忙,种植户忙着管护花卉。
2024-12-06 15:48
2024年11月30日,初冬时节,河南省南阳卧龙岗文化园内,树木换上"新装",宛如一幅五彩斑斓的画卷,吸引不少市民、游客前往赏景。
2024-11-30 18:34
民以食为天,一日三餐承载着居民的幸福感。
2024-11-27 18:59
政协协商与基层社会治理的衔接,可实现协商于民协商为民,让全过程人民民主更好的在基层体现。
2024-11-24 22:51
加载更多