Memcached key value数据库使用详解

简介

Memcached是一个开源、免费、高性能的分布式对象缓存系统，通过减少对数据库的读取以提高Web应用的性能；Memcached基于一个存储键/值对的hashmap。其守护进程（daemon ）是用 C 写的，但是客户端可以用任何语言来编写，并通过memcached协议与守护进程通信。当某个服务器停止运行或崩溃了，所有存放在该服务器上的键/值对都将丢失。

Memcached的服务器端没有提供分布式功能，各个Memcached应用不会互相通信以共享信息。想要实现分布式通过，可以多搭建几个Memcached应用，通过算法实现此效果；

Memcached里有两个重要概念：

slab：为了防止内存碎片化，Memcached服务器端会预先将数据空间划分为一系列slab；举个例子，现在有一个100立方米的房间，为了合理规划这个房间放置东西，会在这个房间里放置 30 个 1 立方米的盒子、20 个 1.25 立方米的盒子、15 个 1.5 立方米的盒子…这些盒子就是slab；
LRU：最近最少使用算法；当同一个slat的格子满了，这时需要新加一个值时，不会考虑将这个新数据放到比当前slat更大的空闲slat，而是使用LRU移除旧数据，放入这个新数据；

部署

Memcached能够在大多数 Linux 和类 BSD 系统上运行；官方没有给出Windows上安装Memcached的支持；

对于Debian / Ubuntu系统：

apt-get install memcached

对于Redhat / Fedora / CentOs系统：

yum install memcached

通过memcached -h查看帮助，同时也算是测试是否安装成功；
如果遇到错误，可参考官方上的FAQ；

使用

服务器端

启动一个Memcached应用，常见的启动方式是这样的：
开启一个memcached应用作守护进程，TCP连接，端口号是 11211；-u参数是运行Memcached应用的用户（这个参数也只有 root用户才能使用）；

memcached -u root -p 11211 -d -vvv

其他常见的参数也有

-m ：分配给Memcached应用使用的内存大小，默认是 64M；
-l ：设置能访问Memcached应用的IP(默认：所有都允许；无论内外网或者本机更换IP，有安全隐患；若设置为127.0.0.1就只能本机访问)；
-c ：设置最大运行的并发连接数，默认是 1024；
-f ：设置slat大小增长因子；默认是 1.25；比如说 10号slab大小是752，那么11号slab大小就是 752 * 1.25；

客户端

Memcached客户端与服务器端的通信比较简单，使用的基于文本的协议，而不是二进制协议；因此可以通过telnet进行交互；

telnet [host] [port]

按下Ctrl + ]，并回车，即可回显；

Storage命令

set
存储数据。如果set的key已经存在，该命令可以更新该key所对应的原来的数据，也就是实现更新的作用。详细命令指南可参考菜鸟教程 – Memcached set 命令；

add
只有在set的key不存在的情况下，才会存储数据；详细命令指南可参考菜鸟教程 – Memcached add 命令；

replace
只有在set的key存在的情况下，才会替换数据；详细命令指南可参考菜鸟教程 – Memcached replace 命令；

append
向已存在的元素值后追加数据；详细命令指南可参考菜鸟教程 – Memcached append 命令；

prepend
向已存在的元素值的头部追加数据；详细命令指南可参考菜鸟教程 – Memcached prepend 命令；

cas
命令用于执行一个”检查并设置”的操作。它仅在当前客户端最后一次取值后，该key 对应的值没有被其他客户端修改的情况下，才能够将值写入。检查是通过cas_token参数进行的，这个参数是Memcach指定给已经存在的元素的一个唯一的 64 位值。详细命令指南可参考菜鸟教程 – Memcached cas 命令；

Retrive命令

get
根据元素的键名获取值；详细命令指南可参考菜鸟教程 – Memcached get 命令；

gets
获取带有CAS令牌的数据值；详细命令指南可参考菜鸟教程 – Memcached gets 命令；

delete
删除已存在的元素；详细命令指南可参考菜鸟教程 – Memcached delete 命令；

incr/decr
对于已存在的键值进行自增或自减操作；详细命令指南可参考菜鸟教程 – Memcached incr/decr 命令；

Statistics命令

stats
查看memcached所有的统计信息；详细命令指南可参考菜鸟教程 – Memcached stats 命令；

stats items
显示各个slab中item的数目和存储时长等其它信息；详细命令指南可参考菜鸟教程 – Memcached stats items 命令；

stats slabs
显示各个slab的信息，包括chunk的大小、数目、使用情况等。详细命令指南可参考菜鸟教程 – Memcached stats slabs 命令；

stats sizes
用于显示所有item的大小和个数。该信息返回两列，第一列是 item 的大小，第二列是 item 的个数。详细命令指南可参考菜鸟教程 – Memcached stats sizes 命令；

flush_all
清除所有缓存数据；详细命令指南可参考菜鸟教程 – Memcached flush_all 命令；

分布式算法

取余算法

根据服务器节点数的余数来进行分散，就是通过hash函数求得的Key的整数哈希值再除以服务器节点数并取余数来选择服务器。这种算法取余计算简单，分散效果好，但是缺点是如果某一台机器宕机，那么应该落在该机器的请求就无法得到正确的处理，这时需要将当掉的服务器从算法从去除，此时候会有 (N-1) / N 的服务器的缓存数据需要重新进行计算；如果新增一台机器，会有N / (N+1)的服务器的缓存数据需要进行重新计算。对于系统而言，这通常是不可接受的颠簸（因为这意味着大量缓存的失效或者数据需要转移）。

【本段内容摘自大脸猫的博客】