人生倒计时
- 今日已经过去小时
- 这周已经过去天
- 本月已经过去天
- 今年已经过去个月
youtube数据(youtube数据查询网站)
youtube视频数据分析维度不包括什么
发布时间。
(使用浏览器扫码进入在线客服窗口)
复制联系方式
查询资料可知,youtube视频数据分析维度是收入、观看时间、互动。不包括发布时间。
YouTube后台给我们提供了强大的数据分析工具,通过advancedmode的自定义模式我们可以筛选数据,在分析YouTube视频数据时,你需要清楚自己的目标是什么。

油管用户数据如何记录
油管用户数据记录方法:
1、记录每条视频的浏览数量。
2、记录多条视频的共同浏览者。
3、记录浏览者的年龄,并将年龄进行分类,理清主要观众的年龄段。
Hive实战之Youtube数据集
本次实战的数据来自于"YouTube视频统计与社交网络"的数据集,是西蒙弗雷泽大学计算机学院在2008年所爬取的数据
数据集地址
数据之间采用"\t"作为分隔符
具体数据如下:
数据量大小为1G,条数为500万+
使用环境为
hive-1.1.0-cdh5.4.5
hadoop-2.6.0-cdh5.4.5
演示形式为使用hive shell
我们一起来看看数据
主要的问题在于category和relatedIDs处理,由于Hive是支持array格式的,所以我们想到的是使用array来存储category和relatedIDs,但是我们发现category的分割符是""而realatedIDs的分隔符是"\t",我们在创建表格的时候能够指定array的分隔符,但是只能指定一个,所以再将数据导入到Hive表格之前我们需要对数据进行一定转换和清洗
并且数据中肯定会存在一些不完整数据和一些奇怪的格式,所以数据的清洗是必要的,我在这里所使用的数据清洗方式是使用Spark进行清洗,也可以使用自定义UDF函数来进行清洗
数据清洗注意点
1)我们可以看到每行数据以"\t"作为分隔符,每行有十列数据,最后一列关联ID可以为空,那么我们对数据进行split之后数组的大小要大于8
2)数据中存在 "uNiKXDA8eyQ KRQE 1035 News amp; Politics 107" 这样格式的数据,所以在处理category时需要注意 News Politics中间的 amp;
处理后的数据如下:
下面的实战都是基于数据清洗后的数据进行的
1)youtube1的创建,文件格式为textfile
create table youtube1(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as textfile;
2)youtube2的创建,文件格式为orc
create table youtube2(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as orc;
3)youtube3的创建,文件格式为orc,进行桶分区
create table youtube3(videoId string, uploader string, age int, category arraystring, length int, views int, rate float, ratings int, comments int,relatedId arraystring)
clustered by (uploader) into 8 buckets
row format delimited
fields terminated by "\t"
collection items terminated by ""
stored as orc;
数据导入:
1)load data inpath "path" into table youtube1;
2)由于无法将textfile格式的数据导入到orc格式的表格,所以数据需要从youtube1导入到youtube2和youtube3:
insert into table youtube2 select * from youtube1;
insert into table youtube3 select * from youtube1;
1)user_tmp的创建,文件格式textfile,24buckets
create table user_tmp(uploader string,videos int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as textfile;
2)user的创建,文件格式orc,24buckets
create table user(uploader string,videos int,friends int)
clustered by (uploader) into 24 buckets
row format delimited
fields terminated by "\t"
stored as orc;
user表的数据导入也是同理
数据导入:
1)load data inpath "path" into table user_tmp;
2)由于无法将textfile格式的数据导入到orc格式的表格,所以数据需要从user_tmp导入到user:
insert into table user select * from user_tmp;
1)统计出观看数最多的10个视频
2)统计出视频类别热度的前10个类型
3)统计出视频观看数最高的50个视频的所属类别
4)统计出观看数最多的前N个视频所关联的视频的所属类别排行
5)筛选出每个类别中热度最高的前10个视频
6)筛选出每个类别中评分最高的前10个视频
7)找出用户中上传视频最多的10个用户的所有视频
8)筛选出每个类别中观看数Top10
select * from youtube3 order by views desc limit 10;
结果如下:
select tagId, count(a.videoid) as sum from (select videoid,tagId from youtube3 lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc limit 10;
结果:
select tagId, count(a.videoid) as sum from (select videoid,tagId from (select * from youtube3 order by views desc limit 20) e lateral view explode(category) catetory as tagId) a group by a.tagId order by sum desc;
结果:
思路:
结果:
思路:
结果如下:
select * from youtube_category where categoryId="Music" order by ratings desc limit 10;
结果如下:
思路:
结果如下:
youtube直播结束后数据怎么查
1、登录YouTube账号。
2、点击右上角“profileicon(头像标志)”,选择“YouTubeStudio”。
3、在右侧面板中能看到指标总结,查看详细分析可点击“GoToChannelAnalytics”或在左侧菜单栏中选择“Analytics”。
4、根据需要可在“Overview”、“Reach”、“Engagement”、“Audience”及“Revenue”(如果适用的话)这几个指标中转换。在本文下一个部分,会有各项指标的详细介绍。
5、详尽的数据分析及各个视频的数据指标情况。
BLACPINK油管粉丝人数突破8000万,她们在海外的人气有多高?
BLACPINK在海外的人气非常高,喜欢和支持她们的粉丝非常多,BLACKPINK的YouTube粉丝订阅量打破全世界所有艺人的最高纪录,也是首个突破该粉丝量的组合,足以感受到她们在海外的人气有多高,在我们国内BLACPINK虽然人气没有达到这个标准,但是依旧深受众多人的追捧,官方宣布BLACPINK回归的消息后,BLACKPINK的YouTube粉丝量就猛增,大家都很期待她们的新专辑,这次她们的回归也让很多粉丝们都非常激动。
BLACPINK油管粉丝人数突破8000万,看到这个数据的确让人觉得有些惊讶, 不知道大家是否有关注过BLACPINK这个组合,该组合是很过YG娱乐经纪公司旗下的组合成员,她们自出道以来就备受大家的瞩目,每位成员都各自有自己的优势,这也是该组合如此备受大家喜欢的原因,她们出道即是巅峰,之后四位成员各自发展,其中JENNIE和LISA的人气最高,如今该组合宣布再次以组合形式回归,粉丝们瞬间就不淡定了。
根据不官方统计来看,BLACKPINK在YouTube上的视频内容累计点击量已经超过了260亿次,她们的主要商业活动就在国外,所以她们在海外的人气也是最高的,有关BLACPINK的话题和视频点击量都非常高。
BLACPINK回归后的首张专辑《BORN PINK》9月16上上线,喜欢的朋友们可以多多关注,我们也希望她们可以继续给我们带来更多优秀的作品,新专辑上线后,她们也会展开大规模的宣传活动,喜欢她们的朋友记得多关注。

