couchbase
Couchbase是用于构建交互式应用程序的NoSQL,面向文档的数据库。 随着NoSQL用于Web,移动和物联网(IoT),开源数据库行业的趋势显示出正增长。
在这次采访中,Couchbase开发人员倡导副总裁Arun Gupta就开放源代码如何对数据库行业产生影响以及NoSQL行业面临的挑战发表了他的看法。 另外,找出Couchbase采用了哪些开源工具和方法。
阿伦(Arun)已撰写了2,000多篇有关技术的博客文章以及几本书。 他已经连续三年被评为JavaOne摇滚明星,并且在美国创立了Devoxx4Kids章节,继续在儿童中推广技术教育。 他公认的头衔包括:Java Champion,JUG负责人,NetBeans Dream Team成员和Docker Captain。
适用于Couchbase的感觉如何?
好吧,我已经在Sun,Oracle和Red Hat建立并领导了10多年的开发者社区,因此我在领导跨职能团队开发和执行策略,规划和执行内容以及营销活动和计划方面具有丰富的经验。 我还曾领导Sun的工程团队,并且是Java EE团队的创始成员。
在Couchbase,开发人员倡导者可以帮助开发人员成为技术,产品,API或平台的有效用户。 这可以通过使用开发人员通常进行视频群聊的媒体共享有关产品的知识来完成。 一些较常见的渠道包括博客,文章,网络研讨会以及会议和聚会中的演讲。 开发人员提倡的常规活动包括回答论坛和Stack Overflow上的问题,社交媒体上的对话以及为开源项目寻求贡献者。
开源如何影响数据库行业,尤其是NoSQL数据库?
简而言之,开源已经彻底改变了数据库行业。
几十年来,数据库都是开源的,并拥有专有许可。 用户受到IBM,Oracle,Microsoft,Teradata和SAP等少数大型供应商的摆布。 企业被迫发布计划和许可计划,而这些计划和许可计划通常与提供技术价值无关,而更多地是关于大化供应商的利润率。 有一些开源数据库(如MySQL,PostgreSQL和SQLite)为大型供应商提供了替代方案,但是在大多数情况下,这些产品缺乏大多数企业所寻求的成熟度,功能深度和稳定性。 直到近,老牌供应商似乎都在锁定数据库行业,进入门槛很高,以至于其他数据库提供商将永远沦为利基市场。
但是发生了两件事:开源数据库产品已经成熟,分布式计算也发生了。
尽管企业继续运行许多“五大” RDBMS产品,但Gartner,Forrester和451 Research等行业分析师以及dbengines.com等软件排名网站已明确表示,成熟的开源数据库不再是利基产品。 分布式计算中的新创新利用了现代化的高性能商品硬件来提供分布式可伸缩数据处理(例如Hadoop和Spark)和分布式可伸缩数据存储(例如HDFS和NoSQL)。
过去10年中开发的提供分布式计算的绝大多数软件产品都是开源的。 这些新产品利用先进的技术功能,敏捷的开发方法和开放源代码的协作许可模型,为用户提供快速的技术创新以及较低的运营成本。
关于NoSQL数据库,几乎所有这些产品都可以在开源许可下使用(Amazon DynamoDB,MarkLogic等少数例外)。 开源NoSQL数据库的数量继续增长。 但是,NoSQL空间的不同之处不仅在于可用产品的数量,还在于开源社区的活力与活力。 令人惊奇的是,《财富》 1000强公司中的采用率继续呈指数级增长,并且这些公司正在为社区做出贡献。 同样,令人惊奇的是,NOSQL用例的任务关键,非利基性质以及这些产品的质量和成熟度。
随着我们继续推动信息社会向前发展并以诸如机器学习之类的形式扩展技术,您对NoSQL数据库行业在未来几年中会遇到哪些挑战?
大的两个挑战可能是围绕技术集成以及保持产品重点,质量和可伸缩性。
从集成的角度来看,您有多种技术(例如Hadoop堆栈,Spark,IoT和NoSQL)在实际标准很少的空间中快速发展。 一方面,您需要选择将资源集中在哪里,并尝试确定哪些趋势,产品和API将被广泛采用,同时又要适应这些趋势,产品和产品的快速变化。蜜蜂。 此外,我们从企业用户那里听到,由于性能和可伸缩性问题,效率低下或执行不善的集成导致浪费时间和精力。 您可能会争辩说,开源NoSQL数据库应该提供所有可能的集成,但是客户并不是真正在寻找每种集成,而是在寻找有效的集成。
从产品质量和可伸缩性的角度来看,NoSQL数据库通过提供专门设计的功能来提供对操作数据的快速访问,从而提供了RDBMS onesizefitsall数据库方法的高性能,高吞吐量替代方案。 例如,将NoSQL与诸如机器学习之类的新技术集成在一起,就需要一种更具交互性,实时性和可操作性的方法,而不是在RDBMS和文件系统集成中更为普遍的批量处理方法。
此外,随着NoSQL数据库的功能和集成变得更加丰富,确实存在失去NoSQL带来的一些性能和可伸缩性优势的风险。 避免风险不是偶然或碰运气的,必须针对风险进行计划和设计。
例如,Couchbase的核心数据库体系结构基于我们的多维扩展(MDS)和数据库更改协议(DCP)。 MDS和DCP使Couchbase能够为数据管理提供面向服务的体系结构(SOA)。 借助MDS,Couchbase可以连续添加数据管理服务,这些服务可以单独配置和分配资源,而不会影响其他服务的吞吐量或行为。 这使客户可以独立地扩展每个服务(扩展,扩展或两者),同时还提供工作负载隔离。 这种基于SOA的数据管理方法允许Couchbase引入完整的JSON SQL(N1QL),全局二级索引,跨数据中心复制(XDCR),内置的全文搜索以及与Spark,Kafka和Hadoop。
Couchbase采用了哪些开源工具和方法?
Couchbase的核心价值之一是我们是一家开源软件公司。 我们认为,开放源代码的意义远不只是简单地提供源代码,还在于我们如何开发软件以及如何与更大的Couchbase社区互动。
这通过以下方式影响我们的开发过程:
- 我们在开放中发展。 我们当前的代码行和签到是公开的。 Couchbase的贡献者可以(并且确实)看到我们正在做的事情并影响其方向。
- 我们执行内部和外部(公共)代码审查。 非Couchbase主题专家的反馈大大提高了产品质量和实用性。 这在开发.NET SDK和Node.js / Ottoman框架等方面特别有用。
- 我们实行透明。 我们的问题追踪器是开放的,并尽可能地包括产品路线图和未来功能说明。
我们这样做是因为我们知道它可以生产出质量更好,功能更短,开发周期更短的产品。
这也会影响我们与Couchbase社区以及更大的开源社区的互动方式:
- 作为开发人员社区网站的一部分,我们在Couchbase.com上托管了交互式Couchbase开发人员论坛,以确保社区是“公司的一部分”,并且公司将重点放在与社区的互动上。
- 作为产品系列的一部分,我们为社区贡献者感到自豪,并在Git History中保持归因。
- Couchbase开发人员为其他开源项目(包括Memcached,Erlang,CouchDB,TCMalloc等项目)做出了上游贡献。
我们这样做是因为成为开源产品的好处与围绕该产品的社区的质量和活力成正比地增加。 要建立一个伟大的开源社区,需要为我们的社区成员提供真正的技术价值,并需要双向交流和贡献的机会。
您认为开源数据库行业目前正在发展什么趋势?
像产品本身一样,开源行业每天都在发展和变化。 也就是说,在不同的供应商,产品和客户中,我们看到了一些共同的趋势。 例如:
- 开源对于创新技术的开发是零基础,而云正是将其部署到生产中的地方。
- 开源业务模型不断发展,其中Freemium模型是当前受欢迎的模型。
- 过去,诸如IBM,Microsoft和Oracle之类的专有许可公司越来越多地提供自己的开源数据库产品。
- 在公共政府组织和私营企业中,越来越多的要求尽可能使用开源解决方案。 还有一种必然的趋势,即将注意力集中和整合到知名的,经过验证的项目上,而不是尝试实施每一个新事物。
- 企业越来越多地采用开源数据库,积极回馈开源社区,甚至将内部产品和工具作为开源发布。 一些示例包括Google,LinkedIn,Facebook,eBay,沃尔玛和Netflix。
- 在企业转向开源技术的动机方面发生了一个非常有趣的转变。 许可成本不再是大原因,它已成为产品质量,创新/竞争功能以及解决问题的能力。 您可以在近的2016年开源未来调查中清楚地看到这一趋势。
开源数据库行业反映了上述许多趋势。 此外,我们还看到:
- 功能交叉和重叠。 传统的关系数据库供应商正在实现成功的开源功能,而开源数据库项目正在实现更传统的关系数据库功能。 这使两种技术的用户受益。
- 开源数据库通过添加数据类型和查询功能来扩大其企业吸引力,这些功能和查询功能扩展了可以使用它们的用例(例如图形,全文本搜索和数据库内分析),提高了它们的安全性和可管理性,并增强了它们与新数据库的集成。和现有技术(例如应用程序容器,Hadoop / Spark和JDBC / ODBC)。
作为开发人员的拥护者,您如何鼓励开发人员参与开源NoSQL数据库项目并为之做出贡献?
开源NoSQL数据库项目以及整个社区从开发人员的参与和贡献中受益匪浅。 无论是在自己的时间上,还是在日常工作中,开发人员都是使这些产品成为现实的人。 当我与热心的开发人员交谈时,他们希望成为这一伟大冒险的一部分,我通常建议:
- GitHub是宇宙的中心。 如果您还不熟悉它,那么一定要。
- 选择一个您喜欢的项目,或者选择一个更好的项目,并成为该项目的专家。 通过要求您的公司将您的部分或全部时间用于回馈他们使用的开源项目来获得公司的支持。
- 在您感兴趣的项目中找到一个区域,然后在此处开始您的贡献。 您知道,这并不总是与编写新功能有关–需要开发的API,要考虑的存储选项,与其他工具和项目的集成以及需要不断审查和改进的示例,文档和测试套件。 例如,专注于文档可能对您和社区中的许多其他人都具有巨大的价值。
- 解决现实世界中的问题。 对社区影响大的贡献是解决许多人遇到的问题的贡献。 在上述任何区域中都可能是一个问题。 奇怪的是,如果这对您来说是个问题,那么对其他用户来说也是一个问题。
- 大多数开源项目都有鼓励参与者参与和贡献的过程-找到并使用它们。 例如,Couchbase致力于将开发人员门户的整个部分专用于与社区合作 。 它包括可用开源项目的列表,开发者论坛的访问权限,如何与Experts and Champions计划打交道以及每月的开发者时事通讯。
简而言之,找到您的社区,了解需要什么并参与进来。 在不知不觉中,您将成为摇滚明星,并且是您喜欢的开源项目的参与者。