临潭| 临漳| 汝城| 钓鱼岛| 普安| 藁城| 石屏| 沂南| 琼结| 河源| 温宿| 安达| 延吉| 玛纳斯| 根河| 肥城| 炉霍| 浮山| 阆中| 阿图什| 天津| 花垣| 泸定| 玛沁| 乐清| 宜宾县| 博山| 白银| 玉龙| 高明| 平和| 涉县| 贵定| 萍乡| 宜秀| 澄江| 哈密| 潜山| 晴隆| 三穗| 扎囊| 麦积| 福鼎| 大安| 阿鲁科尔沁旗| 西宁| 谷城| 贵德| 荣县| 丹巴| 南康| 苍南| 临城| 枣阳| 莘县| 简阳| 新丰| 陆良| 临汾| 新干| 陇县| 滁州| 宣汉| 江宁| 冀州| 衡山| 乌拉特前旗| 青浦| 三台| 阿荣旗| 黄石| 天全| 南宫| 拜泉| 仪陇| 汾西| 绩溪| 金湾| 息县| 芮城| 东安| 榆树| 谷城| 留坝| 鹤山| 子长| 简阳| 娄底| 玛多| 洛浦| 喀喇沁左翼| 乐亭| 曲阜| 门头沟| 南昌县| 玛曲| 宽城| 苏尼特左旗| 枞阳| 汕尾| 东乡| 绵阳| 石屏| 绩溪| 东山| 余干| 眉山| 麻江| 金华| 甘泉| 永宁| 翁牛特旗| 瑞金| 扎兰屯| 歙县| 土默特左旗| 辰溪| 阿荣旗| 高邮| 孟津| 滦县| 城阳| 舞钢| 西乌珠穆沁旗| 博兴| 沿河| 无棣| 襄垣| 张家口| 威信| 孟连| 阿巴嘎旗| 大洼| 芮城| 岚皋| 畹町| 新野| 贵德| 双城| 淮阳| 黎川| 乳源| 武平| 孟村| 苏州| 牟定| 武隆| 涪陵| 磐石| 樟树| 和田| 花垣| 崂山| 彬县| 琼结| 灵寿| 新邵| 绵竹| 改则| 宁明| 友谊| 伊金霍洛旗| 岳阳市| 神农架林区| 乳山| 香港| 小河| 荔波| 通山| 乐山| 五寨| 那坡| 勐海| 郎溪| 泰顺| 百色| 定远| 类乌齐| 信丰| 银川| 酉阳| 宜阳| 永城| 盐田| 缙云| 汤阴| 安县| 青岛| 凤城| 扎兰屯| 迁西| 积石山| 当雄| 南宫| 赣县| 新余| 普兰店| 新晃| 六枝| 郴州| 南乐| 宁海| 青白江| 民权| 南山| 临海| 康马| 灵山| 鄂伦春自治旗| 临桂| 尖扎| 乐陵| 长阳| 江都| 八达岭| 仁化| 神农顶| 汶上| 秀屿| 泰安| 武昌| 汨罗| 嘉善| 内黄| 大丰| 晴隆| 莎车| 象州| 高雄县| 雷波| 宁海| 白城| 巴里坤| 本溪市| 峨眉山| 鄂托克旗| 日喀则| 绥滨| 义马| 乐陵| 托克托| 济源| 平舆| 攀枝花| 唐海| 镶黄旗| 昌乐| 北宁| 云溪| 文昌| 浪卡子| 锦州| 潮南| 息县| 湟源| 长武| 九龙坡| 新田| 延吉| 依安| 河池| 米易| 防城港| 天池| 母婴在线
互联网

票房预测背后的黑盒子:算法通过《战狼2》预测《哪吒》必火无疑

来源:腾讯科技    作者:孙实      2019-09-21
宠物论坛 2017年以来证监会陆续发布多个绿色债券相关政策,逐步完善绿色债券的发行要求,鼓励证券公司承销绿色债券,规范绿色债券评估认证行为,推动绿色债券市场发展。 母婴在线   “在页岩气的生产过程中,我们推行‘减量化—再利用—再循环’的清洁生产方式,做到了水体保护有效、废水重复利用、污水排放为零。 武汉论坛   两国总理充分肯定双方各委员会一年来务实高效的工作。 武汉论坛 老子 论坛资讯 刘庄村 创业资讯 开远市

导语:以预测《哪吒》票房为例,猫眼在前期参考其类型、评分因素,以《大圣归来》为参考影片,后期《哪吒》的票房走势出来后,猫眼发现他与《战狼2》的走势相像,参考《战狼2》的走势调整接下来的票房预测。

《哪吒》上映已经一个多月,这样一部国产动画电影的火爆程度超出了很多人的预料。

谷歌建立的票房预测线性回归模型

这种方式的优点在于简单直接,更接近传统大数据分析“只反映趋势,不深究因果”的理念,上映时间越长,其预测的数据就越为精准,往往适用于掌握了大量票房数据的企业。但缺点在于,其无法将电影上映过程中众多的复杂因素考虑进来,所以经常会出现预测波动大、与实际偏离值较高等缺陷。

第二种思路则较为复杂,而且会将更多的因子纳入到考量因素中来。其先根据历史票房变化预测出某一个档期的总票房,然后根据社交媒体讨论数量、不同导演与演员的历史电影质量、点映用户的评价、票房情况、SEO情况等预测出各电影票房占比,之后综合预测出各电影的实际票房。

这种方式优点在于更多的将“电影评价”这一个重要因子纳入到考量范围内,通过电影导演表现、上映前反馈等等因素来判断出电影的流行趋势,因此预测精准性方面有更好的效果。

第三种思路则综合了大数据分析与人工决策,即先使用大数据分析来对于影片的票房进行一个事先的预测,并输出可视化的数据图表。

与此同时,专家会对具体的电影进行分析,找出其潜在的爆点或是隐患,并评估其可能带来的影响,并以加权的方式纳入到模型之中进行修正。这种方式在预测爆品方面有更好的表现。

在和猫眼的对话中,腾讯科技了解到,猫眼有一套比较完整的票房预测工具,包括实时票房(含未来预售票房)、天级票房预测(未来3天每日大盘票房预测)和总票房预测(单片总票房)等算法,由于猫眼的大数据优势(积累了多年的实时票房详细数据、电影天级票房和总票房样本、以及猫眼平台的交易数据),这些算法可以达到非常好的预测效果,如实时票房准确度度可以达到99%以上,次日天级票房预测准确度可以达到90%左右。

此外,除了算法工具,猫眼也有票房预测的专家,会根据经验提供一些建议,对算法产出的数据会做一定的审核和校对,但总体上以算法产出为主,人的干预比例很小。

这套算法的基本逻辑就是:根据相似电影的票房规律预测新电影的票房,相似电影的选取会有若干条件(如类型、评分、所处档期、票房体量、近期走势等),然后基于这些相似电影,构建预测天级票房或总票房的机器学习模型。

以预测《哪吒》票房为例,猫眼在前期参考其类型、评分因素,以《大圣归来》为参考影片,后期《哪吒》的票房走势出来后,猫眼发现他与《战狼2》的走势相像,参考《战狼2》的走势调整接下来的票房预测。在《哪吒》上映期间,根据多部上映影片的表现情况实时调整其预测票房。

在国外,谷歌也有一套自己的算法预测模型。谷歌的算法模型主要利用搜索、广告点击数据以及院线排片来预测票房。2013年,谷歌就宣布其模型预测票房与真实票房的吻合程度达到了94%。

与此同时,谷歌通过分析自身的数据还发现,在上映前四周时,大部分电影的预告片都是这个时间发布并开始密集的投放广告,因此,这个阶段的用户搜索信息与票房的相关性会更加紧密。

DataHunter也提到了算法大数据预测票房的难点所在:很多大数据分析工具并不考虑因果性,只考虑相关性,经常会带来“虚假相关”的问题,也就是无法对于数据变化的真正原因进行归因。在大多数场景下,这样的预测并没有什么问题,但是在特定的场景下,偏离预测的情况仍有可能会发生。

此外不成熟的市场环境,以及潜在的风险因素,也会对票房预测产生关键影响。比如影片档期选择、宣发策略的一招失误,就可能导致整个影片的票房成几倍的误差。而某个关键演员的负面新闻也同样会带来不可预期的影响,例如某位主演丑闻,导致《情圣2》撤档。

因此,这又引出了下一个问题:如何提高算法预测的准确性?

DataHunter认为,大数据分析与人工决策相结合的方式,其核心原理就是利用人工思维的主观能动性与创造性,发掘电影票房中潜在、但关键的影响因子,最终来得出结论。

对此,猫眼提出的解决方案是:目前算法都是实时训练和预测的,就是针对一个新的待预测电影,实时选取相似电影,并训练模型以及预测,模型的超参数是提前训练好的,短期不会变化,算法的精度随着样本的积累或越来越好。当新样本积累到一定程度,猫眼会对模型重新优化(模型的选择,超参数的优化)。

参考资料:

知乎答主DataHunter

https://www.zhihu.com/question/26742562/answer/602573406

知乎专栏作者Fan ink

https://zhuanlan.zhihu.com/p/20750165

(文章为作者独立观点,不代表艾瑞网立场)
  • 合作伙伴


  • 官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
鹿固乡 江苏吴中区渡村镇 延安路外滩 铁中新村 独义 上胡家花园 长江绿岛 青同镇 安华里社区
刘家堡街道 曰者镇 夹信子镇 五桥街道 费县 上河街街道 安常镇 鸠山乡 新城街道
二十埠河 上方 巴州福利院 丽京门 新西兰 国美 四族乡 陈焦夫村委会 明花乡 张兴庄大道
https://www.whr.cc/bbsitemap.htm