-
首例!Facebook悬赏4万美元寻找数据滥用案例
所属栏目:[大数据] 日期:2018-04-18 热度:131
据外媒报道称,当地时间4月10日(本周二),Facebook宣布了一项奖励计划对于找到Facebook平台上数据滥用案例的用户最高提供4万美元奖励,这是科技行业首次建立这种寻找数据滥用的奖励项目。 据了解,Facebook成立了10个人的赏金审查团队,用于调查数据赏金[详细]
-
大数据技术:内包还是外包
所属栏目:[大数据] 日期:2018-04-14 热度:112
对于零售商来说,大数据是一把双刃剑。这些公司正在努力探索全方位的市场竞争,因为他们试图抵御像亚马逊公司这样的行业巨头,一些公司正在将大量资源部署到开发自己的大数据解决方案中,以试图与零售巨头进行竞争。 零售商面临的一个问题是他们需要内部构[详细]
-
DeepMind:把人工智能和神经科学结合起来,实现良性循环
所属栏目:[大数据] 日期:2018-04-14 热度:59
人工智能的最新进展引人注目。人工系统在 Atari 视频游戏、古老的棋类游戏围棋以及扑克游戏中已经优于人类专业玩家。它们还可以生成与人类无差别的笔迹和语音、在多种语言之间翻译,甚至将你的假期照片用梵高的风格进行风格重塑。 这些进步可以归结为几个[详细]
-
数据分析的四种类型模式
所属栏目:[大数据] 日期:2018-04-14 热度:180
在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。 我想告诉他们的是[详细]
-
深度学习已成功应用于这三大领域
所属栏目:[大数据] 日期:2018-04-14 热度:100
在本章中,我们将介绍如何使用深度学习来解决计算机视觉、语音识别、自然语言处理以及其他商业领域中的应用。首先我们将讨论在许多最重要的AI 应用中所需的大规模神经网络的实现。接着,我们将回顾深度学习已经成功应用的几个特定领域。 尽管深度学习的一[详细]
-
玩转大数据,你应该知道的75个专业术语
所属栏目:[大数据] 日期:2018-04-14 热度:138
如果你刚接触大数据,你可能会觉得这个领域很难以理解,无从下手。不过,你可以从下面这份包含了 25 个大数据术语的清单入手,那么我们开始吧。 算法(Algorithm) :算法可以理解成一种数学公式或用于进行数据分析的统计学过程。那么,「算法」又是何以与大[详细]
-
大数据治理需要具备哪些能力和关键技术?
所属栏目:[大数据] 日期:2018-04-14 热度:95
在企业数据建设过程中,大数据治理受到越来越多的重视。从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,大数据治理的内容在不断发展和完善,其落地实施的过程中会遇到各种各样的难题和挑战。本篇文章通过分析大数据治理建设中的沟沟坎坎[详细]
-
人工智能和机器学习如何帮助IT团队解决数据管理问题
所属栏目:[大数据] 日期:2018-04-14 热度:70
掌握和处理大量数据对于IT部门来说是一个挑战。以下是人工智能(AI)和机器学习如何帮助人们分类、组织和汇总大量信息的方法。 根据三星公司的调查,2016年全球互联网流量超过了1ZB,即10亿兆字节。这个数字是巨大的,但这个数据量与全球各企业正在存储的全[详细]
-
你可能还不知道应用关联防护
所属栏目:[大数据] 日期:2018-04-14 热度:120
近年来,作为高效而直接的数据库防御工事,数据库防火墙已被越来越多的用户关注,应用在关键系统的数据库安全防护中,以保护核心数据资产安全。实现危险行为过滤,数据库防火墙必需串联部署,才能形成数据库的安全屏障。这要求其既要发挥抵御威胁行为的功[详细]
-
数据库防火墙风险大?那是你还不知道应用关联防护
所属栏目:[大数据] 日期:2018-04-14 热度:140
近年来,作为高效而直接的数据库防御工事,数据库防火墙已被越来越多的用户关注,应用在关键系统的数据库安全防护中,以保护核心数据资产安全。要实现危险行为的过滤,数据库防火墙必需串联部署,才能形成数据库的安全屏障。这要求其既要发挥抵御威胁行为[详细]
-
为什么说Python 是大数据全栈式开发语言?
所属栏目:[大数据] 日期:2018-04-14 热度:165
前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做Fullstack JavaScript,是关于用JavaScript进行前端、服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发现Python可[详细]
-
打破数据统一的七大原则
所属栏目:[大数据] 日期:2018-04-12 热度:96
数据统一在数据分析领域里是个长期的挑战,从事数据分析的从业者希望在数据分析之前,来自不同实体的数据能够在同一个地方呈现出来。数据统一由七部分组成:1、获取数据 2、清洗数据 3、转换数据、4、模式集成 5、重复数据删除、6、分类 7、导出 一般而言[详细]
-
物联网下:大数据属于谁?
所属栏目:[大数据] 日期:2018-04-12 热度:113
数据隐私与访问的讨论在物联网时代变得越来越复杂 在之前一些文章中,我已经警告过一些组织机构机构可能很快就会遭遇数据问题被锁定、赶出或以其他方式禁止访问,以有助于优化未来业务的关键新数据源的可能性。 虽然我相信每个数据驱动的组织机构现在就应[详细]
-
大数据趋势下如何实现NAS存储与容灾备份?
所属栏目:[大数据] 日期:2018-04-12 热度:164
1、数据量暴增,存储市场风云变幻 据IDC预测,全球的数据量正面临一个爆炸性增长,到2020年即将达到44ZB,那44ZB是个什么概念呢? 如果以1KB=1024MB计算,1ZB的数据量换成 128G iPad的高度,可达地球到月球距离的6.6倍。 这些数据中,90%的增量来自于非结构[详细]
-
数据清洗的经验与教训 Data Cleaning
所属栏目:[大数据] 日期:2018-04-12 热度:91
小学的时候我统计过同学里有多少要订课间牛奶:每人分别需要什么口味和什么大小,应收多少钱。最后这份按照座位排序的表格要和一张学号表格按照同学姓名对应起来,并计算每种口味订购数量和每人应收款。过程中我遇到了很多困难,例如有同学订了多种口味,[详细]
-
被大数据遗忘的基础奠基-Log
所属栏目:[大数据] 日期:2018-04-12 热度:208
在大数据时代,Log是关系数据库对计算机行业的伟大贡献,更是基础技术之一。然而在大家热烈讨论GFS, NoSQL,乃至Paxos, LSM tree等词语的时候,Log这个基础技术以及它对大数据行业的巨大贡献却一直以来都被业界所忽略。除了Kafka作者之一Jay Kreps2013年[详细]
-
如何在多系统和网络拓扑中构建高性能模型?
所属栏目:[大数据] 日期:2018-04-12 热度:124
这个文档和附带的脚本详细介绍了如何构建针对各种系统和网络拓扑的高性能可拓展模型。这个技术在本文档中用了一些低级的 Tensorflow Python 基元。在未来,这些技术将被并入高级 API。 输入管道 性能指南阐述了如何诊断输入管道可能存在的问题及其最佳解决[详细]
-
大数据“喂养”红利下,知识图谱如何走上新道路?
所属栏目:[大数据] 日期:2018-04-12 热度:83
大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的喂养下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽[详细]
-
服务端开发指南与最佳实战:数据存储技术,MySQL 数据库安全性
所属栏目:[大数据] 日期:2018-04-12 热度:131
数据库的安全性,即保护数据库,防止未经授权或不合法的使用而造成的数据泄漏和更改破坏。因此,保护数据库的安全性的一般方法是设置用户标识和权限控制。 MySQL 权限控制,分为两个步骤。第一步骤,服务器会检查是否允许连接。因为创建用户的时候会加上主[详细]
-
TensorFlow的开源与Hadoop的开源有什么不同?
所属栏目:[大数据] 日期:2018-04-12 热度:168
最近看TensorFlow代码的时候,用Git pull下来最新的master一看,哇好多的更新,然后点击去之前看到一半的cc文件继续看,好多地方都改变了。但是一看Git log,有好多巨大的commit叫什么 Merge commit for internal changes, Merge for github,没有任何的其[详细]
-
最适合Java开发者的大数据工具和框架
所属栏目:[大数据] 日期:2018-04-12 热度:190
当今编程人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。根据外媒的一项调查报告,以下列出了Java程序员在过去12个月内一直使用的一些工具或框架,或许会对你有意义。 先来看看大数[详细]