-
// 对于一个数组返回第二大数
所属栏目:[大数据] 日期:2021-01-18 热度:172
// 对于一个数组返回第二大数int GetSecondMax(int arr[]){int max = arr[0],secondMax = arr[0];for(int i = 0; i sizeof(arr); i++){if(arr[i] secondMax){secondMax = arr[i];if(secondMax max){max = max + secondMax;secondMax = max - secondMax;max[详细]
-
BigData学习2_分布式基础(1):CAP原理、BASE思想和最终一致性
所属栏目:[大数据] 日期:2021-01-18 热度:117
副标题#e# CAP,BASE和最终一致性是NoSQL数据库存在的三大基石。 CAP ? C:?Consistency 一致性 A:?Availability 可用性(指的是快速获取数据) P: Tolerance of network?Partition 分区容忍性(分布式) ????在足球比赛里,一个球员在一场比赛中进三个球,称之[详细]
-
[ZJOI 2013] bzoj3110 K大数查询 【树套树】
所属栏目:[大数据] 日期:2021-01-18 热度:78
副标题#e# Description 有N个位置,M个操作。操作有两种,每次操作如果是1 a b c的形式表示在第a个位置到第b个位置,每个位置加入一个数c 如果是2 a b c形式,表示询问从第a个位置到第b个位置,第C大的数是多少。 Input 第一行N,M 接下来M行,每行形如1 a[详细]
-
超全面的2017校招数据分析岗笔试、面试知识点大总结
所属栏目:[大数据] 日期:2021-01-17 热度:182
副标题#e# 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。 尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是应该也抱着好的期望去找自己满意的呢? 最近笔试了很多家公司校招的数据分[详细]
-
大数据处理项目相关
所属栏目:[大数据] 日期:2021-01-17 热度:164
副标题#e# mapReduce部分 * MapReduce MAP :映射 reduce :归纳* 简单来说,一个映射函数就是对一些独立元素组成的概念上的列表(例如,一个测试成绩的列表)的每一个元素进行指定的操作(比如,有人发现所有学生的成绩都被高估了一分,他可以定义一个“减一[详细]
-
TF-IDF与余弦相似性的应用(二):找出相似文章
所属栏目:[大数据] 日期:2021-01-17 热度:148
今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子[详细]
-
BI Publisher(rtf)模板开发语法大全(转)
所属栏目:[大数据] 日期:2021-01-17 热度:97
Rtf模板开发例如背景,纹理分栏等等功能都能用word工具实现不再具体总结大家可以参考word教程。。。。。 ? 一.组 定义一个组的目的是告诉XMLPublisher对重复的数据行进行循环显示,也就是说需要使用for-each进行数据记录的循环显示 ?for-each:XML group el[详细]
-
OMXCodec数据处理过程
所属栏目:[大数据] 日期:2021-01-17 热度:72
OMXCodec数据处理过程 (2011-09-02 23:25:39) 转载 ▼ buffer的处理主要由以下4个命令来进行驱动 OMXCodec使用OMX_EmptyThisBuffer传递未解码的buffer给component, component收到该命令后会读取input port buffer中的数据,将其组装成帧进行解码,Verdana; f[详细]
-
已用1.6亿份病例训练人工智能,大数医达要把机器培养成中级医生
所属栏目:[大数据] 日期:2021-01-17 热度:139
副标题#e# 同一个治疗方案的疗效,因人而异,存在很大的不确定性。而且治疗过程不可逆,永远回不到昨天。这些特点,给训练模型造成了很大技术障碍。 文 | 刘涌 从医院信息系统,到电子病历系统,到跨系统的集成平台,到基于人工智能技术的临床诊疗辅助决策[详细]
-
基于VGI签到类目关联规则挖掘
所属栏目:[大数据] 日期:2021-01-17 热度:102
用c#语言写的一个数据挖掘的算法,数据是深圳和香港的2015新浪微博签到数据。 1.数据分析 签到数据中能够体现用户行为特性的只有[Category]。这个字段下的数据都可以表示用户当前的一个行为。用户每一条签到数据代表了该用户当下的一个行为,所以用户所有[详细]
-
家电产品如何创新?挖掘产品性能和市场需求是关键
所属栏目:[大数据] 日期:2021-01-17 热度:180
最近几年,国内家电行业不太景气,根据国家统计局的数据,今年上半年零售额方面,彩电同比下跌4%、冰箱下跌7%、洗衣机下跌3%、空调下跌1.9%、冰柜大跌14.8%。这些数据均反映出国内家电市场正处于前所未有的困境之中。 不过,家电行业所面临的问题并不能完[详细]
-
HDU 5901 大数素数计数
所属栏目:[大数据] 日期:2021-01-17 热度:117
Count primes Time Limit: 12000/6000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Total Submission(s): 1234 ? ?Accepted Submission(s): 679 Problem Description Easy question! Calculate how many primes between [1...n]! ? In[详细]
-
有奖话题讨论—大数据预测黄金周
所属栏目:[大数据] 日期:2021-01-17 热度:141
“大数据”到底是什么? 这个概念乍看上去相当模糊, 却越来越多的渗入到了我们日常的生活。 无论你从事什么行业, 无论你学的什么专业, 只要能从实际出发写下你对黄金周的预测, 都有机会获得奖品! 角度不限, 内容不限。 活动目的 每天全球膨大的物流[详细]
-
分享 :大数据人才应如何挖掘与培养?
所属栏目:[大数据] 日期:2021-01-17 热度:76
优秀的人才是成事的根本。当开始真正做事的时候,人们会发现:优秀的人才是短缺的。于是,竞争的高端变成了人才的竞争。对于大数据这样新兴的发展方向来说,更是如此。大数据的热头,今年虽然有被人工智能和虚拟现实掩盖的趋势,但其势头依然火热。而且更[详细]
-
推荐 :从大数据中挖掘什么
所属栏目:[大数据] 日期:2021-01-17 热度:162
副标题#e# 概要:大数据挖掘中最重要的是决定挖掘什么样的知识,这是在数据的收集、处理、挖掘的整个过程中都需要认真考虑的问题。本文首先提出大数据挖掘的几项策略,即尽量设想挖掘的场景,尽量多方面收集数据,尽量将数据整合,悉心观察数据特征。之后结[详细]
-
网购评论是真是假?文本挖掘告诉你
所属栏目:[大数据] 日期:2021-01-17 热度:147
本文作者?毕马威大数据团队,首次发表于“KPMG大数据挖掘”(公众号:kpmgbigdata)。 无数网友在各个电商网站的促销大旗下开启买买买模式,不过,当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?商品评论一定是一个重要的参[详细]
-
全国高校R语言大数据分析与机器学习研修班
所属栏目:[大数据] 日期:2021-01-10 热度:92
(培训采用案例教学方式,因选用案例较多,大纲中不一一罗列)[详细]
-
[bigdata-001] mysql 5.7 由于安全问题不能导出数据的解决方式
所属栏目:[大数据] 日期:2021-01-10 热度:53
1. create user 'b1'@'localhost' identified by 'b1'; grant all privileges on *.* to 'b1'@'localhost' identified by 'b1'; 2. select oid into outfile '/home/brian/xxx.csv' from android_user_event_sorted; ERROR 1290 (HY000): The MySQL server[详细]
-
[bigdata-002]python3 以get方式获取json的api
所属栏目:[大数据] 日期:2021-01-10 热度:125
1. server.py #!/usr/bin/env python3#-*- coding:utf-8 -*-import osimport jsonimport picklefrom flask import Flask,request,render_template,jsonify,make_response,url_forfrom impala.dbapi import connect#flask appapp = Flask(__name__)@app.rou[详细]
-
[bigdata-002]python3 +flask 以post方式获取json的api
所属栏目:[大数据] 日期:2021-01-10 热度:100
1. server.py #!/usr/bin/env python3#-*- coding:utf-8 -*-import osimport jsonimport picklefrom flask import Flask,request,render_template,jsonify,make_response,url_forfrom impala.dbapi import connect#flask appapp = Flask(__name__)@app.rou[详细]
-
[bigdata-003]在cdh 5.7下 用sqoop1将mysql数据库数据导入到hdfs
所属栏目:[大数据] 日期:2021-01-10 热度:94
1. 假设,myql安装在bigdata2上。我们要在bigdata3上执行sqoop1。 2. 首先,要在mysql上创建一个'b3'@'%'的账户,这个账户限定只能从外部ip地址访问mysql。 3. 在bigdata3上做如下操作 http://www.cloudera.com/documentation/enterprise/5-7-x/topics/cdh[详细]
-
挖掘微信Web版通信的全过程
所属栏目:[大数据] 日期:2021-01-10 热度:89
昨天是周末,在家闲得无聊,于是去weiphone.com逛了一圈,偶然发现有人发了一帖叫《微信 for Mac》,这勾起了我的好奇心,国内做Mac开发的人确实很少,对于那些能够独自开发一些Mac第三方工具的开发者我都表示很敬畏,于是点进去看了一个究竟,如果你们好[详细]
-
[bigdata-004]CDH Impala的应用场景
所属栏目:[大数据] 日期:2021-01-09 热度:152
可以将Impala视为改进版的Hive。 两者都使用SQL语言,且Imapal的SQL是Hive SQL的子集。 Hive慢,Impala快,测试的结果是,常规问题上,Impala比Hive快十倍。有了Impala,Hive就可以不用了。 Impala没有索引。这是一个非常显著的特征,没有索引,就不能快速[详细]
-
LightOJ1214 Large Division (大数求余,同余定理)
所属栏目:[大数据] 日期:2021-01-09 热度:157
Given two integers,a and b,you should check whether a is divisible by b or not. We know that an integer a is divisible by an integer b if and only if there exists an integer c such that a = b * c. Input Input starts with an integer T (≤[详细]
-
汇编语言之数据处理的2个基本问题
所属栏目:[大数据] 日期:2021-01-09 热度:183
副标题#e# ?? 1、bx、si、di和bp Bx、si和di这3个寄存器我们已经学过了,现在进行一下总结,并学一下bp。 1:在8086CPU中,只有这4个寄存器可以用在[…]中来进行内存单元的寻址。比如,下面的指令都是正确 的: Mov ax,[bx] Mov ax,[bx+si] Mov ax,[bx+di[详细]