-
为啥云原生数据湖值得关注
所属栏目:[大数据] 日期:2022-06-25 热度:73
最近几年,数据湖正在被越来越多人提起,尽管各方对数据湖的定义并不统一,但这不妨碍企业纷纷下水实践,比如亚马逊、阿里、腾讯、华为等,都在探索建设数据湖。为何众多企业在数据湖是什么上还没有达成共识的情况下,就开始着手进军数据湖领域呢?一个可[详细]
-
大数据如何通过销售自动化创造更多的机遇
所属栏目:[大数据] 日期:2022-06-25 热度:133
大数据技术如今在各行业领域的业务方面非常重要。销售行业是受大数据影响最大的领域之一。仅在2020年,全球各地的企业就在营销分析上花费了28亿美元,这个数字每年都在大幅增长。 这就是数据分析将发挥重要作用的地方。销售公司可以仔细查看数据,了解渠道[详细]
-
高考结束 用 Python 来解析下哪里的高考是地狱级难度
所属栏目:[大数据] 日期:2022-06-25 热度:56
一年一度的高考,可以说是广大学子必经的磨练,正所谓十年寒窗苦,一朝天下知。而高考,也成为了当前中国最为广泛,最为公平的晋升之路,可以说考上了一个名牌大学,那么未来的道路会好走很多。 但是又由于我国幅员辽阔,各地的教育资源又不尽相同,从而导[详细]
-
何为数据湖?用于大数据分析的大规模可扩展存储
所属栏目:[大数据] 日期:2022-06-25 热度:161
从那时起,数据湖技术不断发展,现在正在与数据仓库争夺大数据存储和分析的市场份额。各种工具和产品支持数据湖中更快的SQL查询,而全球三个主要云计算提供商都提供了数据湖存储和分析。甚至还推出了将治理、安全性和分析与成本更低的存储结合起来的数据湖[详细]
-
不良数据会造成更严重后果的几个原由
所属栏目:[大数据] 日期:2022-06-25 热度:161
现在回想起来,这是有道理的。当时不仅存在基础设施方面的挑战,而且使用网络的人并不多,网站也没有那么有价值。随着云计算、电子商务和SaaS的兴起,这种情况发生了变化,确保可靠性成为企业的关键任务,站点可靠性工程(SRE)应运而生。 数据如今处于相似[详细]
-
数据分析常见的误区有哪几种
所属栏目:[大数据] 日期:2022-06-25 热度:80
数据分析常见的误区有哪些? 1、盲目的收集数据 一个正常运营的产品每天会产生大量的数据,如果把这些数据都收集起来进行分析,不仅会使工作量增加,浪费大量时间,很可能还会得不到想要的分析结果。作为一名数据分析人员,更不应该为了分析而分析,而是应[详细]
-
如何管理高度可扩大系统中的元数据
所属栏目:[大数据] 日期:2022-06-25 热度:107
元数据过去对数据中心架构的影响很[详细]
-
做数据治理前 应该明白并避开的几大坑
所属栏目:[大数据] 日期:2022-06-25 热度:167
Gartner 的一项调查显示,超过90%的数据治理项目都以失败告终。 这个数据可能会劝退一大波正准备做或者正在观望数据治理的企业:既然这笔投资90% 的概率失败,那为什么要继续。 1. 目标不明晰 数据治理是一个复杂的系统工程,一个明确合理的目标,能让数据[详细]
-
大数据平台核心架构图鉴 提议收藏
所属栏目:[大数据] 日期:2022-06-25 热度:59
大数据的核心层应该是:数据采集层、数据存储与分析层、数据共享层、数据应用层,可能叫法有所不同,本质上的角色都大同小异。 所以我下面就按这张架构图上的线索,慢慢来剖析一下,大数据的核心技术都包括什么。 01数据采集 数据采集的任务就是把数据从各[详细]
-
新时代开源数据调度在1000+企业的进化之途
所属栏目:[大数据] 日期:2022-06-25 热度:75
近年来,随着互联网的飞速发展,业务量在短时间内呈现爆发式增长,对应的数据量快速从数百 G 涨至数百 T。无论数据存储还是数据调度,当前数据量已经远超处理能力的上限。若信息处理技术仍渐进式发展,数据处理能力的提升将远落后于指数级增长的数据量。[详细]
-
如何使云原生运维化繁为简
所属栏目:[大数据] 日期:2022-06-12 热度:127
云计算带来了集约化、效率、弹性与业务敏捷的同时,对云上运维提出了前所未有的挑战。如何面对新技术趋势的挑战,构建面向云时代的智能监测平台,让云上应用获得更好的保障,是如今摆在每一个企业面前的一道难题。 在日前的【TTalk】系列活动第八期中,51C[详细]
-
如何借助Python创建机器学习模型
所属栏目:[大数据] 日期:2022-06-12 热度:126
你是否会遇到这样的场景,当你训练了一个新模型,有时你不想费心编写 Flask Code(Python的web 框架)或者将模型容器化并在 Docker 中运行它,就想通过 API 立即使用这个模型? 如果你有这个需求,你肯定想了解MLServer。它是一个基于Python的推理服务器,[详细]
-
转向未来的AI自动化测试工具
所属栏目:[大数据] 日期:2022-06-12 热度:174
近年来,自动化测试已经发生了重大的迭代。它在很大程度上协助QA团队减少了人为错误的可能。虽然目前有许多工具可以被用于自动化测试,但合适的工具一直是自动化测试成败与否的关键。同时,随着人工智能、机器学习和神经网络在各个领域的广泛运用,面向人[详细]
-
微型机器学习有望让深度学习嵌入微处理器
所属栏目:[大数据] 日期:2022-06-12 热度:83
深度学习模型最初的成功归功于拥有大量内存和GPU集群的大型服务器。深度学习的前景催生了一个为深度神经网络提供云计算服务的行业。因此,在几乎无限的云资源上运行的大型神经网络变得非常流行,这对于具有充足预算的科技公司尤其如此。 但与此同时,近年[详细]
-
人工智能平台计划中的质量工程设计
所属栏目:[大数据] 日期:2022-06-12 热度:183
我们正处在人工智能的黄金时代。人工智能方案的采用使得企业更具创造性、竞争力和快速响应能力。软件即服务(software-as-a-service,SaaS)模式,加上云技术的进步,使软件生产和消费过程越来越成熟。 普遍存在的一个事实是,大多数组织更喜欢购买现成的[详细]
-
开启元宇宙的数字人之行
所属栏目:[大数据] 日期:2022-06-12 热度:147
作为构建元宇宙内容的基石,数字人是最早可落地且可持续发展的元宇宙细分成熟场景,目前,虚拟偶像、电商带货、电视主持、虚拟主播等商业应用已被大众认可。在元宇宙世界中,最核心的内容之一非数字人莫属,因为数字人不光是真实世界人类在元宇宙中的化身[详细]
-
使用机器学习重塑视频中的人脸
所属栏目:[大数据] 日期:2022-06-12 热度:188
来自于中、英两国的一项合作研究设计出了一种在视频中重塑面孔的新方法。该技术可以扩大和缩小面部结构,同时还具有高度一致性,并且没有人工修剪的痕迹 一般而言,这种面部结构的转化通过传统的 CGI 方法来实现,而传统的 CGI 方法依托详细且昂贵的运动封[详细]
-
由于智能数据库的自助式机器学习
所属栏目:[大数据] 日期:2022-06-12 热度:66
由于智能数据库的自助式机器学习 1.如何成为一个IDO? IDO(insight-driven organization)指洞察力驱动(以信息为导向)的组织。要成为一个IDO,首先需要数据以及操作和分析数据的工具;其次是具有适当经验的数据分析师或数据科学家;最后还需要找到一种技术或者[详细]
-
元宇宙在艺术领域的探索
所属栏目:[大数据] 日期:2022-06-12 热度:169
在元宇宙概念火爆的当下,各行业均开始了在这片富地中的探索。而在诸多行业之中,艺术行业与元宇宙的融合互促效果尤为明显。在不久前MetaCon元宇宙技术大会上,触角科技有限公司联合创始人、大有不言文化有限公司创始人谷强为我们带来了《元宇宙在艺术行业[详细]
-
美团图神经网络训练架构的实践和探索
所属栏目:[大数据] 日期:2022-06-12 热度:127
美团搜索与NLP团队在图神经网络的长期落地实践中,基于业务实际场景,自主设计研发了图神经网络框架Tulong,以及配套的图学习平台,提升了模型的规模和迭代效率。 1. 前言 万物之间皆有联系。图作为一种通用的数据结构,可以很好地描述实体与实体之间的关[详细]
-
几时使用机器学习
所属栏目:[大数据] 日期:2022-06-12 热度:97
为什么要探讨这个话题 探讨这个话题的本质原因是来源于为客户提供数据战略咨询服务时的思考,很多客户的痛点与诉求看似可以用机器学习解决,但实际上却充满风险,所以究竟机器学习什么时候该用,什么时候不该用,便成为了思考的对象。 机器学习起源于学术[详细]
-
如何让程序员更简单使用机器学习
所属栏目:[大数据] 日期:2022-06-12 热度:127
一直以来,人们试图手工编写算法来理解人工生成的内容,但是成功率极低。例如,计算机很难掌握图像的语义内容。对于这类问题,AI科学家已经尝试通过分析汽车、猫、外套等低级像素来解决,但结果并不理想。尽管颜色直方图和特征检测器在一定程度上发挥了作[详细]
-
如何建造一支高效率的人工智能团队?
所属栏目:[大数据] 日期:2022-06-12 热度:148
本文将介绍把机器学习基础设施、员工和流程融合的方式,以实现适用于企业的MLOps(面向人工智能系统的运维管理)。本文希望对旨在以高效人工智能团队开发强大的人工智能/机器学习(AI/ML)项目的经理和主管提供启发。 本文的经验来自Provectus公司的人工智能团[详细]
-
从开始懂互联网到懂用户,谷歌这次都押了哪些宝?
所属栏目:[大数据] 日期:2022-06-12 热度:147
谷歌 I/O 大会如约而至。谷歌 I/O 2022 大会开幕式上,谷歌 CEO Sundar Pichai 发表了长达 2 小时的以知识和计算为关键词的主题演讲。这次演讲在勾勒谷歌长期发展愿景的同时,也在某种程度上描绘后疫情时代的互联网技术的演进方向。 搜索再定义:Anyway、A[详细]
-
线下零售要怎么构建AI自动结账服务?
所属栏目:[大数据] 日期:2022-06-12 热度:119
客户体验是线上零售的重要优势,无需排队、没有延迟、采购便捷。但根据Forrester研究报告,由于人们希望在购买前充分了解产品,或只是不喜欢等待商品运输的过程,美国72%的零售消费仍然依靠实体店面。 目前,无人售货的创意方案在亚马逊无人便利店(Amazon[详细]