导航:首页 > 电影资源 > 哪里可以对电影做数据统计

哪里可以对电影做数据统计

发布时间:2023-03-15 17:39:42

㈠ 豆瓣电影数据分析

这篇报告是我转行数据分析后的第一篇报告,当时学完了Python,SQL,BI以为再做几个项目就能找工作了,事实上……分析思维、业务,这两者远比工具重要的多。一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于:a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢?;b.没有一个确切有效的分析模型/框架,会有种东一块西一块的拼接感。
即便有着这些缺点,我还是想把它挂上来,主要是因为:1.当做Pandas与爬虫(Selenium+Request)练手,总得留下些证明;2.以豆瓣电影进行分析确实很难找到一条业务逻辑线支撑,总体上还是描述统计为主;3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错;

本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据,采集对象包括:电影名称、年份、导演、演员、类型、出品国家、语言、时长、评分、评论数、不同评价占比、网址。经过去重、清洗,最后得到29033条有效电影数据。根据电影评分、时长、地区、类型进行分析,描述了评分与时长、类型的关系,并统计了各个地区电影数量与评分。之后,针对演员、导演对数据进行聚合,给出产量与评分最高的名单。在分析过程中,还发现电影数量今年逐步增加,但评分下降,主要原因是中国地区今年低质量影视作品的增加。

另外,本篇报告还爬取了电影票房网( http://58921.com/ )1995-2020年度国内上映的影片票房,共采集4071条数据,其中3484条有效。进一步,本文分析了国内院线电影票房年度变化趋势,票房与评分、评价人数、时长、地区的关系,票房与电影类型的关联,并给出了票房最高的导演、演员与电影排名。

清洗、去重后,可以看到29033条数据长度、评分、评论数具有以下特点:

结合图1(a)(b)看,可以看到电影数据时长主要集中在90-120分钟之间,向两极呈现阶梯状递减,将数据按照短(60-90分钟),中(90-120分钟),长(120-150分钟),特长(>150分钟)划分,各部分占比为21.06%, 64.15%, 11.95%, 2.85%。

结合图2(a)看,可以看到我们采集到的电影数据评分主要集中在6.0-8.0之间,向两极呈现阶梯状递减,在此按照评分划分区间:2.0-4.0为口碑极差,4.0-6.0为口碑较差,6.0-7.0为口碑尚可,7.0-8.0为口碑较好,8.0-10.0为口碑极佳。

这5种电影数据的占比分别为:5.78%, 23.09%, 30.56%, 29.22%, 11.34%

再将评分数据细化到每年进行观察,可以发现,30年内电影数量与年度电影均分呈反相关,年度均分整体呈现下降趋势,2016年电影均分最低,电影数量最多。

进一步做出每个年份下不同评级等级的电影数据占比,可以发现,近年来,评分在[2.0,6.0)的电影数据占比有着明显提升,评分在[6.0,7.0)的数据占比不变,评分在[7.0,10.0)的数据占比减少,可能原因有:

对照图5,可以发现,评分与时长、评论人数的分布大致呈现漏斗状,高分电影位于漏斗上部,低分电影位于漏斗下部。这意味着,如果一部电影的评论人数很多(特别是超过30w人观影),时长较长(大于120min),那么它大概率是一部好电影。

根据各个国家的电影数量作图,可以得到图6,列出电影数量前十的国家可得表格2,发现美国在电影数量上占第一,达到8490部,中国其次,达6222部。此外,法国,英国,日本的电影数量也超过1000,其余各国电影数量相对较少。这可以说明美国电影有着较大的流量输入,在中国产生了较大的影响。

进一步分析各国电影的质量,依据评分绘制评分箱线图可得图7,在电影数量排名前20的国家中:

接着我们可以探索,哪个国家的电影对豆瓣评分随年份下降的贡献最大,考虑到电影数量对应着评分的权重。根据上述各国的电影评分表现,我们可以猜测电影数量较多的国家可能对年度均分的下降有较大影响。于是,我们再计算出这些国家的年度电影均分,并与整体均分进行比较分析。

再作出中国大陆,中国台湾,中国香港的均分箱线图图9(a),可以看到,大陆电影均分低于港台电影,且存在大量低分电影拉低了箱体的位置。

分析相关性可得,大陆、香港、台湾电影年度均分与全部评分关联度分别为R=0.979,0.919,0.822,说明滤去台湾和香港电影,大陆电影年度均分的变化趋势与全部评分变化更接近。图9(b)可以进一步反映这一点。

可以看到,大部分类型集中在X×Y=[10000,30000]×[6.00,7.50]的区间范围内,剧情、喜剧、爱情、犯罪、动作类电影数量上较多,说明这些题材的电影是近三十年比较热门的题材,其中剧情类电影占比最多,音乐、传记类电影平均得分更高,但在数量上较少,动作、惊悚类电影评论人数虽多,但评价普遍偏低。

除此之外,还有两块区域值得关注:

根据类型对电影数据进行聚合,整理得到各类型电影评分的时间序列,计算它们与整体均分时间序列的相关性,可得表格4与图11,可以看到剧情,喜剧,悬疑这三种类型片与总分趋势变化相关性最强,同时剧情、喜剧类电影在电影数量上也最多,因此可以认为这两类电影对于下跌趋势影响最大,但其余类别电影的相关性也达到了0.9以上,说明几种热门的电影得分的变化趋势与总体均分趋势一致。

前面已经得知,中美两国电影占比最高,且对于均分时间序列的影响最大。在此,进一步对两国电影进行类型分析,选取几种主要的类型(数量上较多,且相关性较高)进行分析,分别是剧情,喜剧,爱情,惊悚,动作,悬疑类电影,绘制近年来几类电影的数量变化柱状图与评分箱线图可得图12,13,14,15。

对导演与演员进行聚合,得到数据中共有15011名导演,46223名演员。按照作品数量在(0,2], (2,5], (5,10], (10,20], (20,999]进行分组统计导演数量,可以发现,15009名导演中有79.08%只拍过1-2部作品,46220名演员中有75.93%只主演过1-2部作品。忽略那些客串、跑龙套的演员,数据总体符合二八定律,即20%的人占据了行业内的大量资源。

在此,可以通过电影得分、每部电影评论人数以及电影数目寻找优秀的电影导演与演员。这三项指标分别衡量了导演/演员的创作水平,人气以及产能。考虑到电影数据集中可能有少量影视剧/剧场版动画,且影视剧/剧场版动画受众少于电影,但得分普遍要高于电影,这里根据先根据每部电影评论数量、作品数量来筛选导演/演员,再根据电影得分进行排名,并取前30名进行作图,可得图17,18。

结合电影票房网( http://58921.com/ )采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量、票房变化趋势,票房与评分、评价人数、时长、地区以及类型的关系,此外还给出了不同导演与演员的票房表现以及影片票房排名。

如图19所示,国内票房数据与上映的电影数量逐年递增,2020年记录的只是上半年的数据,且由于受疫情影响,票房与数量骤减。这说明在不发生重大事件的情况下,国内电影市场规模正在不断扩大。

对电影数据根据类型进行聚合,绘制散点图21,可以发现:

提取导演/演员姓名,对导演/演员字段进行聚合,计算每个导演/演员的票房总和,上映电影均分、以及执导/参与电影数目进行计算,作出票房总和前30名的导演/演员,可得图22,23,图中导演/演员标号反映了票房排名,具体每位导演/演员的上映影片数量、均分、每部电影评价人数、平均时长与总票房在表5、表6中给出。

最后根据电影票房进行排名,得到票房排名前20的电影如表格7所示,可以看到绝大部分上榜电影都是中国电影,索引序号为3、10、12、14、18、19为美国电影,这也反映了除国产电影之外,好莱坞大片占据较大的市场。

本篇报告采集了1990-2020年间豆瓣电影29033组有效数据,从豆瓣电影的评分、时长、地区、类型、演员、导演以及票房等信息进行分析评价,主要有以下结论:

㈡ 有关电影票房权威数据哪里

专资办,当然我们没有账号,所以可以参考中国电影报(有新浪微博)和艺恩票房数据(供参考),新浪微博可以关注夏舞光影和晴天雨的2011,有日票房和周票房播报,两位是电影局内部人士

㈢ 哪个比较好的网站能查询电影票房

以下是网址:http://58921.com/alltime/,可以查出内地电影票房总排行榜。

㈣ 11月电影市场数据分析哪里有

中商情报网讯:10月全国票房最终收官于36.44亿,同比下降29.3%,创下2016年9月之后,整整两年来的单月跌幅之最。在经过7月和8月暑期档单月大盘连续两个月逼近70亿大关后,后期电影票房明显下沉。目前已进入到2018年第四季度,但电影市场还是保持着一贯的冷漠。不过在国庆假期的加持下,10月票房相比9月30.99亿元来说,环比增长17.6%;单月观影人次为10531万人,环比增长19.82%;10月电影上映场次983.15万场,比9月上映场次增加了85.17万场。2018年1-10月全国市场共产出综合票房约525亿元。
2018年1-10月票房收入突破525亿
中国电影产业在国民经济新的发展形势下实现了稳健增长。以电影票房收入衡量,我国电影市场已经成为仅次于美国的全球第二大电影市场。统计数据显示,我国电影票房市场近年来保持高速增长的态势,观影人次从2007年的0.71亿,增长2016年的13.72亿,年均复合增长率达到34.47%。国内电影票房从2012年的170.7亿元增长到2017年559.1亿元,年均复合增长率达到26.78%。2018年1-10月全国电影票房累计达525.3亿元。按照今年电影票房趋势来看,2018年全国电影票房超越2017年的559.1亿元基本是毫无压力。
数据来源:中商产业研究院整理
10月电影市场凄惨收官 同比大降29.3%
根据猫眼专业版数据,2018年10月电影票房共计36.44亿元,较去年同期51.53亿元票房,同比下降29.3%。10月上映影片中,国庆档影片《无双》《影》等影片票房居前。
除4月票房有所下滑外,2018年单月票房都取得较好的成绩,其中2月101亿票房位居榜首,这无疑给2018年电影市场带来了一个良好的开端!2018年上半年电影市场大涨18%,进入到暑期档7月-8月,票房再次实现大涨,其中7月同比增长37.9%至69.5亿元,仅次于春节档2月票房,到8月票房同比略有下滑。9月票房下沉明显,环比大降54.6%。10月在国庆假期加持下票房环比增长17.6%。但却是2016年9月之后,整整两年来的单月同比跌幅之最。
数据来源:猫眼、艺恩、中商产业研究院整理
《无双》单月票房第一《影》排名第二
在2018年10月电影票房排行榜上,榜单前十部影片中有7部电影票房都在1亿元之上,3部影片超3亿大关。其中庄文强执导的犯罪题材港片《无双》以票房11.69亿霸占月度冠军之位。该片9月底上映累计票房顺利破10亿,累计分账票房成功超越《澳门风云3》(11.16亿),打破发哥演员生涯的内地票房纪录。截至11月1日14:30,该片连续24日获得单日票房冠军,累计综合票房达到12.26亿元,分账票房11.3亿元,猫眼评分高达8.9分,口碑与票房双丰收。
影片《影》单月票房第二,10月票房为5.59亿元,猫眼评分8.2分。作为张艺谋申奥影片,《影》自筹拍时期就成为相关媒体的聚焦点。尽管《影》在视觉上追求的以水墨风格形成的形式化美感再次以极致表现给观众留下深刻印象,但这部作品并未给观众带来更多的惊喜和震撼。月度排名第三的是开心麻花团队的喜剧片《李茶的姑妈》,10月累计票房4.95亿元,猫眼评分7.9分。《找到你》票房第四,10月累计票房2.67亿元。《胖子行动队》以2.28亿元票房排名第五,《铁血战士》10月票房拿下1.72亿元,排名第六。
数据来源:猫眼、中商产业研究院整理
前三电影票房占比超六成
10月全国电影票房分布集中在国庆档影片,排名前五部都是国庆档电影。其中《无双》单月占据总票房32.1%,《影》占比15.3%,《李茶的姑妈》占13.6%。排名前三位的电影票房占比合计占当月总票房的61.3%。
数据来源:猫眼、中商产业研究院整理
11月上映电影前瞻
从阵容来看,11月进口片是迪士尼与华纳兄弟在国内电影市场的一次交锋。迪士尼在月初与月末先后上映真人童话电影《胡桃夹子与四个国王》与经典动画续集电影《无敌破坏王2:大闹互联网》。华纳兄弟则发力下半场,在月中与月末先后上映《神奇动物:格林德沃之罪》与亚裔阵容的喜剧爱情电影《摘金奇缘》。另外《毒液》作为“蜘蛛侠宇宙”中的非典型英雄,该片北美市场目前累计票房达到1.87亿美元。值得一提的是,目前《毒液》联合火箭少女101推出的推广歌曲《毒液前来》成功引起公众注意,猫眼想看人数超过30万,11月进口片中人数最高。11月上映影片信息一起来看一下吧!
资料来源:猫眼、中商产业研究院整理
更多资料请参考中商产业研究院发布的《2018-2023年中国电影行业发展前景及投资机会分析报告》。

㈤ 国内有没有统计电影票房的权威网站

我介绍一个博客,你可以跟博主交流一下,也许他能帮到你
http://www.mtime.com/my/john87421/blog/1443105/
他专门统计票房的

㈥ 我电脑里很多的电影,怎样快速比较准确的统计出电影的数量。

把E盘的电影放到E盘一个文件夹里,
打开文件夹,左下方会显示文件数量,XX个对象,就是电影数量。

同理。
把F盘的也放到F盘的一个文件夹里,
也可以看到。
两个加起来,就知道了。

㈦ 哪个网站可以看到全国电影票房统计

目前国内统计票房的机构主要有两家,一个是广电总局电影专项资金办公室,另一个是中国电影发行放映协会。前者是通过影院的计算机售票系统统计,后者是通过各个放映单位逐层联网上报完成。
但是由于目前通过安装计算机售票系统完成数据报送的影院只存在于大城市的部分主流院线(业内称为一级市场),像县级市这样的二级市场和农村市场,以及主流院线内没有安装计算机售票系统的影院,仍然是以手工统计上报为主。

㈧ 影片预算成本怎么

只有票房可以查询,制作成本没有公开可查的数据库,但如果单纯想知道一部电影的制作成本还是可以很快捷的找到的。你可以选择两种方式查询:

1、网络搜索电影名+成本,在这方面网络没有聚合功能,所以需要从中筛选比较靠谱的媒体发布的采访中的数据,如果媒体靠谱的话数据都是经过核实的。

2、或者你可以谷歌电影名字+Budget,会直接出现电影的制片成本,数据多来自于维基网络。

如果媒体和维基冲突,建议以靠谱媒体为准。
《疯狂的石头》票房破1600万 宁浩:我没赚|2006年07月30日09:25 上海青年报

㈨ 可以用什么软件查到某个影院的观影人数

你直接在美团里点定票,里面会显示哪些座位已经被买下了,你不就知道多少人看了,一看你就一定是个小学生,这些都不懂。现在科技这么发达了。

阅读全文

与哪里可以对电影做数据统计相关的资料

热点内容
电影票时间来不及了怎么退票 浏览:117
dp有什么电影 浏览:917
乔杉演的好看电影 浏览:840
苹果手机怎么录电影里声音 浏览:882
女人被变成动物电影有哪些 浏览:632
南瓜电影为什么没有国外的 浏览:976
巨齿鲨电影门票多少钱一张 浏览:779
2021春节上映的电影哪部好看 浏览:819
哪些电影佩特拉古城 浏览:769
ipad播放电影比例怎么设置 浏览:704
好看的美国预言电影 浏览:274
电影院怎么追女孩 浏览:255
抖音怎么发布电影作品 浏览:519
任达华拍过哪些尺度大的电影迅雷下载 浏览:235
周星弛的如来神掌是什么电影 浏览:35
内衣先生电影免费观看优酷 浏览:692
免费看最新电影手机app 浏览:77
看懂英文电影需要多久 浏览:960
哪些电影在长寿区取景 浏览:466
微电影刷车是什么意思 浏览:450