你也能写个 Shadowsocks #12

gwuhaolin · 2017-11-03T11:24:28Z

本文将教你从0写一个Shadowsocks，无需任何基础，读完本文你就能完成一个轻量级、高性能的 Shadowsocks 代替品。

我们暂且把最终完成的项目叫做 Lightsocks，如果你很急切地想看到结果，可以先体验本文最终完成的项目 Lightsocks ，也可以下载阅读源码。

认识 Shadowsocks

Shadowsocks 是一个能骗过防火墙的网络代理工具。它把要传输的原数据经过加密后再传输，网络中的防火墙由于得不出要传输的原内容是什么而只好放行，于是就完成了防火墙穿透，也即是所谓的“翻墙”。

在自由的网络环境下，在本机上访问服务时是直接和远程服务建立连接传输数据，流程如图：

但在受限的网络环境下会有防火墙，本机电脑和远程服务之间传输的数据都必须通过防火墙的检查，流程如图：

如果防火墙发现你在传输受限的内容，就把拦截本次传输，就会导致在本机无法访问远程服务。

而 Shadowsocks 所做的就是把传输的数据加密，防火墙得到的数据是加密后的数据，防火墙不知道传输的原内容是什么，于是防火墙就放行本次请求，于是在本机就访问到了远程服务，流程如图：

也就是说使用 Shadowsocks 的前提是：

一台在防火墙之外的服务器；
在本机需要安装 Shadowsocks 本地端，用于加密传输数据；
服务器需要安装 Shadowsocks 服务端，用于解密加密后的传输数据，解密出原数据后发送到目标服务器。

Shadowsocks 原理

Shadowsocks 由两部分组成，运行在本地的 ss-local 和运行在防火墙之外服务器上的 ss-server，下面来分别详细介绍它们的职责（以下对 Shadowsocks 原理的解析只是我的大概估计，可能会有细微的差别）。

ss-local

ss-local 的职责是在本机启动和监听着一个服务，本地软件的网络请求都先发送到 ss-local，ss-local 收到来自本地软件的网络请求后，把要传输的原数据根据用户配置的加密方法和密码进行加密，再转发到墙外的服务器去。

ss-server

ss-server 的职责是在墙外服务器启动和监听一个服务，该服务监听来自本机的 ss-local 的请求。在收到来自 ss-local 转发过来的数据时，会先根据用户配置的加密方法和密码对数据进行对称解密，以获得加密后的数据的原内容。同时还会解 SOCKS5 协议，读出本次请求真正的目标服务地址(例如 Google 服务器地址)，再把解密后得到的原数据转发到真正的目标服务。

当真正的目标服务返回了数据时，ss-server 端会把返回的数据加密后转发给对应的 ss-local 端，ss-local 端收到数据再解密后，转发给本机的软件。这是一个对称相反的过程。

由于 ss-local 和 ss-server 端都需要用对称加密算法对数据进行加密和解密，因此这两端的加密方法和密码必须配置为一样。Shadowsocks 提供了一系列标准可靠的对称算法可供用户选择，例如 rc4、aes、des、chacha20 等等。Shadowsocks 对数据加密后再传输的目的是为了混淆原数据，让途中的防火墙无法得出传输的原数据。但其实用这些安全性高计算量大的对称加密算法去实现混淆有点“杀鸡用牛刀”。

SOCKS5 协议介绍

Shadowsocks 的数据传输是建立在 SOCKS5 协议之上的，SOCKS5 是 TCP/IP 层面的网络代理协议。
ss-server 端解密出来的数据就是采用 SOCKS5 协议封装的，通过 SOCKS5 协议 ss-server 端能读出本机软件想访问的服务的真正地址以及要传输的原数据，下面来详细介绍 SOCKS5 协议的通信细节。

建立连接

客户端向服务端连接连接，客户端发送的数据包如下：

VER	NMETHODS	METHODS
1	1	1

其中各个字段的含义如下：
-VER：代表 SOCKS 的版本，SOCKS5 默认为0x05，其固定长度为1个字节；
-NMETHODS：表示第三个字段METHODS的长度，它的长度也是1个字节；
-METHODS：表示客户端支持的验证方式，可以有多种，他的长度是1-255个字节。

目前支持的验证方式共有：

0x00：NO AUTHENTICATION REQUIRED（不需要验证）
0x01：GSSAPI
0x02：USERNAME/PASSWORD（用户名密码）
0x03: to X'7F' IANA ASSIGNED
0x80: to X'FE' RESERVED FOR PRIVATE METHODS
0xFF: NO ACCEPTABLE METHODS（都不支持，没法连接了）

响应连接

服务端收到客户端的验证信息之后，就要回应客户端，服务端需要客户端提供哪种验证方式的信息。服务端回应的包格式如下：

VER	METHOD
1	1

其中各个字段的含义如下：

VER：代表 SOCKS 的版本，SOCKS5 默认为0x05，其固定长度为1个字节；
METHOD：代表服务端需要客户端按此验证方式提供的验证信息，其值长度为1个字节，可为上面六种验证方式之一。

举例说明，比如服务端不需要验证的话，可以这么回应客户端：

VER	METHOD
`0x05`	`0x00`

和目标服务建立连接

客户端发起的连接由服务端验证通过后，客户端下一步应该告诉真正目标服务的地址给服务器，服务器得到地址后再去请求真正的目标服务。也就是说客户端需要把 Google 服务的地址google.com:80告诉服务端，服务端再去请求google.com:80。
目标服务地址的格式为 (IP或域名)+端口，客户端需要发送的包格式如下：

VER	CMD	RSV	ATYP	DST.ADDR	DST.PORT
1	1	`0x00`	1	Variable	2

各个字段的含义如下：

VER：代表 SOCKS 协议的版本，SOCKS 默认为0x05，其值长度为1个字节；
CMD：代表客户端请求的类型，值长度也是1个字节，有三种类型；
- CONNECT： 0x01；
- BIND： 0x02；
- UDP： ASSOCIATE 0x03；
RSV：保留字，值长度为1个字节；
ATYP：代表请求的远程服务器地址类型，值长度1个字节，有三种类型；
- IPV4： address: 0x01；
- DOMAINNAME: 0x03；
- IPV6： address: 0x04；
DST.ADDR：代表远程服务器的地址，根据 ATYP 进行解析，值长度不定；
DST.PORT：代表远程服务器的端口，要访问哪个端口的意思，值长度2个字节。

服务端在得到来自客户端告诉的目标服务地址后，便和目标服务进行连接，不管连接成功与否，服务器都应该把连接的结果告诉客户端。在连接成功的情况下，服务端返回的包格式如下：

VER	REP	RSV	ATYP	BND.ADDR	BND.PORT
1	1	`0x00`	1	Variable	2

各个字段的含义如下：

VER：代表 SOCKS 协议的版本，SOCKS 默认为0x05，其值长度为1个字节；
REP代表响应状态码，值长度也是1个字节，有以下几种类型
- 0x00 succeeded
- 0x01 general SOCKS server failure
- 0x02 connection not allowed by ruleset
- 0x03 Network unreachable
- 0x04 Host unreachable
- 0x05 Connection refused
- 0x06 TTL expired
- 0x07 Command not supported
- 0x08 Address type not supported
- 0x09 to 0xFF unassigned
RSV：保留字，值长度为1个字节
ATYP：代表请求的远程服务器地址类型，值长度1个字节，有三种类型
- IP V4 address： 0x01
- DOMAINNAME： 0x03
- IP V6 address： 0x04
BND.ADDR：表示绑定地址，值长度不定。
BND.PORT：表示绑定端口，值长度2个字节

数据转发

客户端在收到来自服务器成功的响应后，就会开始发送数据了，服务端在收到来自客户端的数据后，会转发到目标服务。

总结

SOCKS5 协议的目的其实就是为了把来自原本应该在本机直接请求目标服务的流程，放到了服务端去代理客户端访问。
其运行流程总结如下：

本机和代理服务端协商和建立连接；
本机告诉代理服务端目标服务的地址；
代理服务端去连接目标服务，成功后告诉本机；
本机开始发送原本应发送到目标服务的数据给代理服务端，由代理服务端完成数据转发。

以上内容来自 SOCKS5 协议规范 rfc1928。

Lightsocks 实现

要实现 Lightsocks 需要实现两部分：运行在本地的 lightsocks-local，和运行在墙外代理服务器上 lightsocks-server。
下面来分别教你如果使用 Golang 来实现它们，采用 Golang 语言的原因在于：性能好、跨平台、适合高并发、学习门槛低。对Golang感兴趣？请看Golang 中文学习资料汇总

实现数据混淆

在 Shadowsocks 中是采用的标准的对称加密算法去实现数据混淆的，对称算法在加密和解密过程中需要大量计算。
为了简单起见，Lightsocks 将采用最简单高效的方法去实现数据混淆，具体原理如下。

这个数据混淆算法和对称加密很相似，两端都需要有同样的密钥。
这个密钥有如下要求：

由256个 byte 组成，也就是一个数组，在 Golang 中类型表示为 [256]byte；
这个数组必须由 0～255 这256个数字组成，一个都不能差；
这个数组中第I个的值不能等于I；

例如以下为一个合法的密钥(上为索引，下为值)：

0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	19	20	21	22	23	24	25	26	27	28	29	30	31	32	33	34	35	36	37	38	39	40	41	42	43	44	45	46	47	48	49	50	51	52	53	54	55	56	57	58	59	60	61	62	63	64	65	66	67	68	69	70	71	72	73	74	75	76	77	78	79	80	81	82	83	84	85	86	87	88	89	90	91	92	93	94	95	96	97	98	99	100	101	102	103	104	105	106	107	108	109	110	111	112	113	114	115	116	117	118	119	120	121	122	123	124	125	126	127	128	129	130	131	132	133	134	135	136	137	138	139	140	141	142	143	144	145	146	147	148	149	150	151	152	153	154	155	156	157	158	159	160	161	162	163	164	165	166	167	168	169	170	171	172	173	174	175	176	177	178	179	180	181	182	183	184	185	186	187	188	189	190	191	192	193	194	195	196	197	198	199	200	201	202	203	204	205	206	207	208	209	210	211	212	213	214	215	216	217	218	219	220	221	222	223	224	225	226	227	228	229	230	231	232	233	234	235	236	237	238	239	240	241	242	243	244	245	246	247	248	249	250	251	252	253	254	255
186	118	82	201	235	236	180	66	228	96	43	90	203	200	34	104	41	222	165	74	240	20	244	67	114	191	220	147	196	183	229	123	208	19	127	187	84	148	56	170	133	160	202	21	53	78	59	64	120	27	167	175	39	10	4	132	89	230	152	73	221	88	141	158	251	79	225	87	14	23	68	250	199	168	218	60	40	169	75	86	153	134	83	49	128	231	217	239	226	177	57	24	234	63	7	112	166	211	254	179	157	215	227	224	233	81	172	26	122	219	48	151	232	50	108	44	0	192	65	76	109	252	248	47	154	33	209	115	31	15	45	206	247	124	77	8	182	144	1	72	131	52	245	198	238	5	188	116	55	216	155	2	178	189	162	136	243	184	58	69	70	99	36	25	35	174	195	18	205	30	190	142	210	113	145	101	97	161	100	91	242	138	93	171	98	237	212	255	80	102	119	204	107	105	111	11	29	146	129	117	135	176	163	207	103	22	246	125	150	106	126	197	249	62	51	193	32	3	110	46	85	71	159	139	12	164	95	121	140	241	253	130	173	213	54	143	16	94	9	61	156	214	28	17	37	42	181	149	185	223	92	38	13	194	6	137

如果原数据为 [5,0,1,2,3]，则采用以上密钥加密后变成 [236,186,118,82,201]。
如果加密后的数据为 [186,118,82,201,235]，则采用以上密钥解密得到的原数据为 [0,1,2,3,4]

聪明的你肯定看懂了其中的规律：把1～255 这256个数字确定一种一对一的映射关系，加密是从一个数字得到对应的一个数字，而解密则是反向的过程，而这个密钥的作用正是描述这个映射关系。
这其实就是中学学的反函数。

为什么要这样设计数据混淆算法呢？在数据传输时，数据是以 byte 为最小单位流式传输的。一个 byte 的取值只可能是 0～255。该混淆算法可以直接对一个个 byte 进行加解密，而无需像标准的对称算法那样只能对一大块数据进行加密。
再加上本算法的加解密 N byte 数据的算法复杂度为 N（直接通过数组索引访问），非常适合流式加密。

以上加密算法的安全性怎么样呢？符合以上要求的密钥匙有多少种组合呢？我们来算算：
这其实就是初中学的排列组合中的排列问题，形象点其实就是，把 0～255 个不同编号的人安排到 0～255 个不同编号的坑去，并且不能有编号一样的情况，有多少种排法。
也就是 A(255,255)=255*254*253*...*1=255!，但其中有一半为有重复的情况，
最终结果为 255!/2，
其值大概为 10^500 这个数量级。

以上加密算法虽然破绽很多，但足以实现高效的数据混淆，骗过防火墙。

目前采用对称加密算法实现数据混淆的 Shadowsocks 已经能被一些防火墙通过机器学习算法通过特征分析识别出传输的原内容适合合法，而 Lightsocks 的这套混淆算法目前还不能被轻易的识别出来。

随机产生一个以上密钥匙的代码如下：

package core
import (
	"math/rand"
	"time"
)
const PasswordLength = 256
type Password [PasswordLength]byte

func init() {
	// 更新随机种子，防止生成一样的随机密码
	rand.Seed(time.Now().Unix())
}

// 产生 256个byte随机组合的 密码
func RandPassword() *Password {
	// 随机生成一个由  0~255 组成的 byte 数组
	intArr := rand.Perm(PasswordLength)
	password := &Password{}
	for i, v := range intArr {
		password[i] = byte(v)
		if i == v {
			// 确保不会出现如何一个byte位出现重复
			return RandPassword()
		}
	}
	return password
}

对数据进行加密解密的代码如下：

package core

type Cipher struct {
	// 编码用的密码
	encodePassword *Password
	// 解码用的密码
	decodePassword *Password
}

// 加密原数据
func (cipher *Cipher) encode(bs []byte) {
	for i, v := range bs {
		bs[i] = cipher.encodePassword[v]
	}
}

// 解码加密后的数据到原数据
func (cipher *Cipher) decode(bs []byte) {
	for i, v := range bs {
		bs[i] = cipher.decodePassword[v]
	}
}

// 新建一个编码解码器
func NewCipher(encodePassword *Password) *Cipher {
	decodePassword := &Password{}
	for i, v := range encodePassword {
		encodePassword[i] = v
		decodePassword[v] = byte(i)
	}
	return &Cipher{
		encodePassword: encodePassword,
		decodePassword: decodePassword,
	}
}

再使用以上的 Cipher 去封装一个加密传输的 SecureSocket，以方便直接加解密 TCP Socket 中的流式数据，代码如下：

package core

import (
	"errors"
	"fmt"
	"io"
	"net"
)

const (
	BufSize = 1024
)

// 加密传输的 TCP Socket
type SecureSocket struct {
	Cipher     *Cipher
	ListenAddr *net.TCPAddr
	RemoteAddr *net.TCPAddr
}

// 从输入流里读取加密过的数据，解密后把原数据放到bs里
func (secureSocket *SecureSocket) DecodeRead(conn *net.TCPConn, bs []byte) (n int, err error) {
	n, err = conn.Read(bs)
	if err != nil {
		return
	}
	secureSocket.Cipher.decode(bs[:n])
	return
}

// 把放在bs里的数据加密后立即全部写入输出流
func (secureSocket *SecureSocket) EncodeWrite(conn *net.TCPConn, bs []byte) (int, error) {
	secureSocket.Cipher.encode(bs)
	return conn.Write(bs)
}

// 从src中源源不断的读取原数据加密后写入到dst，直到src中没有数据可以再读取
func (secureSocket *SecureSocket) EncodeCopy(dst *net.TCPConn, src *net.TCPConn) error {
	buf := make([]byte, BufSize)
	for {
		readCount, errRead := src.Read(buf)
		if errRead != nil {
			if errRead != io.EOF {
				return errRead
			} else {
				return nil
			}
		}
		if readCount > 0 {
			writeCount, errWrite := secureSocket.EncodeWrite(dst, buf[0:readCount])
			if errWrite != nil {
				return errWrite
			}
			if readCount != writeCount {
				return io.ErrShortWrite
			}
		}
	}
}

// 从src中源源不断的读取加密后的数据解密后写入到dst，直到src中没有数据可以再读取
func (secureSocket *SecureSocket) DecodeCopy(dst *net.TCPConn, src *net.TCPConn) error {
	buf := make([]byte, BufSize)
	for {
		readCount, errRead := secureSocket.DecodeRead(src, buf)
		if errRead != nil {
			if errRead != io.EOF {
				return errRead
			} else {
				return nil
			}
		}
		if readCount > 0 {
			writeCount, errWrite := dst.Write(buf[0:readCount])
			if errWrite != nil {
				return errWrite
			}
			if readCount != writeCount {
				return io.ErrShortWrite
			}
		}
	}
}

// 和远程的socket建立连接，他们之间的数据传输会加密
func (secureSocket *SecureSocket) DialRemote() (*net.TCPConn, error) {
	remoteConn, err := net.DialTCP("tcp", nil, secureSocket.RemoteAddr)
	if err != nil {
		return nil, errors.New(fmt.Sprintf("连接到远程服务器 %s 失败:%s", secureSocket.RemoteAddr, err))
	}
	return remoteConn, nil
}

这个 SecureSocket 用于 local 端和 server 端之间进行 TCP 通信，并且只使用 SecureSocket 通信时中间传输的数据会被加密，防火墙无法读到原数据。

实现 local 端

运行在本机的 local 端的职责是把本机程序发送给它的数据经过加密后转发给墙外的代理服务器，总体工作流程如下：

监听来自本机浏览器的代理请求；
转发前加密数据；
转发socket数据到墙外代理服务端；
把服务端返回的数据转发给用户的浏览器。

实现以上功能的 local 端代码如下：

package local

import (
	"github.com/gwuhaolin/lightsocks/core"
	"log"
	"net"
)

type LsLocal struct {
	*core.SecureSocket
}

// 新建一个本地端
func New(password *core.Password, listenAddr, remoteAddr *net.TCPAddr) *LsLocal {
	return &LsLocal{
		SecureSocket: &core.SecureSocket{
			Cipher:     core.NewCipher(password),
			ListenAddr: listenAddr,
			RemoteAddr: remoteAddr,
		},
	}
}

// 本地端启动监听，接收来自本机浏览器的连接
func (local *LsLocal) Listen(didListen func(listenAddr net.Addr)) error {
	listener, err := net.ListenTCP("tcp", local.ListenAddr)
	if err != nil {
		return err
	}

	defer listener.Close()

	if didListen != nil {
		didListen(listener.Addr())
	}

	for {
		userConn, err := listener.AcceptTCP()
		if err != nil {
			log.Println(err)
			continue
		}
		// userConn被关闭时直接清除所有数据 不管没有发送的数据
		userConn.SetLinger(0)
		go local.handleConn(userConn)
	}
	return nil
}

func (local *LsLocal) handleConn(userConn *net.TCPConn) {
	defer userConn.Close()

	proxyServer, err := local.DialRemote()
	if err != nil {
		log.Println(err)
		return
	}
	defer proxyServer.Close()
	// Conn被关闭时直接清除所有数据 不管没有发送的数据
	proxyServer.SetLinger(0)

	// 进行转发
	// 从 proxyServer 读取数据发送到 localUser
	go func() {
		err := local.DecodeCopy(userConn, proxyServer)
		if err != nil {
			// 在 copy 的过程中可能会存在网络超时等 error 被 return，只要有一个发生了错误就退出本次工作
			userConn.Close()
			proxyServer.Close()
		}
	}()
	// 从 localUser 发送数据发送到 proxyServer，这里因为处在翻墙阶段出现网络错误的概率更大
	local.EncodeCopy(proxyServer, userConn)
}

实现 server 端

运行在墙外代理服务器的 server 端职责如下：

监听来自本地代理客户端的请求；
解密本地代理客户端请求的数据，解析 SOCKS5 协议，连接用户浏览器真正想要连接的远程服务器；
转发用户浏览器真正想要连接的远程服务器返回的数据的加密后的内容到本地代理客户端。

实现以上功能的代码如下：

package server

import (
	"encoding/binary"
	"github.com/gwuhaolin/lightsocks/core"
	"log"
	"net"
)

type LsServer struct {
	*core.SecureSocket
}

// 新建一个服务端
func New(password *core.Password, listenAddr *net.TCPAddr) *LsServer {
	return &LsServer{
		SecureSocket: &core.SecureSocket{
			Cipher:     core.NewCipher(password),
			ListenAddr: listenAddr,
		},
	}
}

// 运行服务端并且监听来自本地代理客户端的请求
func (lsServer *LsServer) Listen(didListen func(listenAddr net.Addr)) error {
	listener, err := net.ListenTCP("tcp", lsServer.ListenAddr)
	if err != nil {
		return err
	}

	defer listener.Close()

	if didListen != nil {
		didListen(listener.Addr())
	}

	for {
		localConn, err := listener.AcceptTCP()
		if err != nil {
			log.Println(err)
			continue
		}
		// localConn被关闭时直接清除所有数据 不管没有发送的数据
		localConn.SetLinger(0)
		go lsServer.handleConn(localConn)
	}
	return nil
}

// 解 SOCKS5 协议
// https://www.ietf.org/rfc/rfc1928.txt
func (lsServer *LsServer) handleConn(localConn *net.TCPConn) {
	defer localConn.Close()
	buf := make([]byte, 256)

	/**
	   The localConn connects to the dstServer, and sends a ver
	   identifier/method selection message:
		          +----+----------+----------+
		          |VER | NMETHODS | METHODS  |
		          +----+----------+----------+
		          | 1  |    1     | 1 to 255 |
		          +----+----------+----------+
	   The VER field is set to X'05' for this ver of the protocol.  The
	   NMETHODS field contains the number of method identifier octets that
	   appear in the METHODS field.
	*/
	// 第一个字段VER代表Socks的版本，Socks5默认为0x05，其固定长度为1个字节
	_, err := lsServer.DecodeRead(localConn, buf)
	// 只支持版本5
	if err != nil || buf[0] != 0x05 {
		return
	}

	/**
	   The dstServer selects from one of the methods given in METHODS, and
	   sends a METHOD selection message:

		          +----+--------+
		          |VER | METHOD |
		          +----+--------+
		          | 1  |   1    |
		          +----+--------+
	*/
	// 不需要验证，直接验证通过
	lsServer.EncodeWrite(localConn, []byte{0x05, 0x00})

	/**
		          +----+-----+-------+------+----------+----------+
		          |VER | CMD |  RSV  | ATYP | DST.ADDR | DST.PORT |
		          +----+-----+-------+------+----------+----------+
		          | 1  |  1  | X'00' |  1   | Variable |    2     |
		          +----+-----+-------+------+----------+----------+
	*/

	// 获取真正的远程服务的地址
	n, err := lsServer.DecodeRead(localConn, buf)
	// n 最短的长度为7 情况为 ATYP=3 DST.ADDR占用1字节 值为0x0
	if err != nil || n < 7 {
		return
	}

	// CMD代表客户端请求的类型，值长度也是1个字节，有三种类型
	// CONNECT X'01'
	if buf[1] != 0x01 {
		// 目前只支持 CONNECT
		return
	}

	var dIP []byte
	// aType 代表请求的远程服务器地址类型，值长度1个字节，有三种类型
	switch buf[3] {
	case 0x01:
		//	IP V4 address: X'01'
		dIP = buf[4 : 4+net.IPv4len]
	case 0x03:
		//	DOMAINNAME: X'03'
		ipAddr, err := net.ResolveIPAddr("ip", string(buf[5:n-2]))
		if err != nil {
			return
		}
		dIP = ipAddr.IP
	case 0x04:
		//	IP V6 address: X'04'
		dIP = buf[4 : 4+net.IPv6len]
	default:
		return
	}
	dPort := buf[n-2:]
	dstAddr := &net.TCPAddr{
		IP:   dIP,
		Port: int(binary.BigEndian.Uint16(dPort)),
	}

	// 连接真正的远程服务
	dstServer, err := net.DialTCP("tcp", nil, dstAddr)
	if err != nil {
		return
	} else {
		defer dstServer.Close()
		// Conn被关闭时直接清除所有数据 不管没有发送的数据
		dstServer.SetLinger(0)

		// 响应客户端连接成功
		/**
		          +----+-----+-------+------+----------+----------+
		          |VER | REP |  RSV  | ATYP | BND.ADDR | BND.PORT |
		          +----+-----+-------+------+----------+----------+
		          | 1  |  1  | X'00' |  1   | Variable |    2     |
		          +----+-----+-------+------+----------+----------+
		*/
		// 响应客户端连接成功
		lsServer.EncodeWrite(localConn, []byte{0x05, 0x00, 0x00, 0x01, 0x00, 0x00, 0x00, 0x00, 0x00, 0x00})
	}

	// 进行转发
	// 从 localUser 读取数据发送到 dstServer
	go func() {
		err := lsServer.DecodeCopy(dstServer, localConn)
		if err != nil {
			// 在 copy 的过程中可能会存在网络超时等 error 被 return，只要有一个发生了错误就退出本次工作
			localConn.Close()
			dstServer.Close()
		}
	}()
	// 从 dstServer 读取数据发送到 localUser，这里因为处在翻墙阶段出现网络错误的概率更大
	lsServer.EncodeCopy(localConn, dstServer)
}

以上就是实现一个轻量级 Shadowsocks 的核心代码。其它一些零碎的代码，例如启动入口、配置读写等，可以去 lightsocks 项目中阅读完整代码。

阅读原文

The text was updated successfully, but these errors were encountered:

gwuhaolin/blog#12

kalasoo · 2017-11-06T03:35:14Z

rickytan · 2017-11-29T06:22:25Z

穿墙的解释不太对吧，https 也加密的，为什么访问不了 google/twitter

mhlau233 · 2017-12-03T09:39:55Z

实际用对称加密并不能无脑解密 aes加密是分块的
比如说
0x01 0x02 0x03 0x04
加密成 0xd1 0xd2 0xd3 0xd4
如果你缺了先收到前两个 0xd1 0xd2 可以解出0x01 0x02
但后面的0xd3 0xd4 解不出0x03 0x04

请问应该如何解决这个问题真心不想看源码，大佬求告知一下
原版python写那一大堆实在是看不下去你知道的话给个大概思路我自己CPP实现

antonchen · 2017-12-06T08:30:12Z

为什么都是基于 SOCKS5 来做混淆呢，SOCKS5 会暴露一个端口专门提供服务不便于隐藏，难道是因为 SOCKS5 很快么？

v2ray 有基于 WebSocket 协议的，但是 v2ray 在我使用中非常耗费 CPU，所以放弃了。

提到 v2ray WebSocket 协议的原因是，我可以用 Nginx 反向代理 WebSocket，把翻墙服务隐藏再一个网站中，比起 SOCKS5 协议会减少 Server 端的暴露几率。

不懂代码层面的事情，请指教。

lenovobenben · 2017-12-09T00:38:55Z

你这个就是SS最原始的table加密。
SS进化到AEAD不是没有道理的。
你可以看看这篇文章
https://blessing.studio/why-do-shadowsocks-deprecate-ota/

ccsexyz · 2017-12-09T02:11:13Z

以其昏昏使人昭昭

timqian · 2017-12-09T03:17:01Z

@antonchen SOCKS5 的端口不会暴露到公网，在 ss-local 作为 socks server 接收浏览器的请求，在 ss-server 作为 socks client 向目标服务器（比如google）发送请求。
数据加密解密过程发生在 ss-local 与 ss-server 之间的通信

antonchen · 2017-12-09T04:22:28Z

@timqian 我指的就是 ss-server 的端口

timqian · 2017-12-09T04:44:03Z

@antonchen ss-server 不暴露端口怎么和 ss-local 通信？

antonchen · 2017-12-09T05:00:16Z

@timqian 使用 WebSocket 监听在 localhost 上，Nginx 反向代理 WebSocket，使服务隐藏在一个 VirtualHost 中，甚至某个 URL 中。

wanghanfeng · 2017-12-20T09:40:44Z

@rickytan https只是对包体进行加密，防火墙还是能通过包头来解析出你的请求行为，并且阻止。

QuantumGhost · 2017-12-30T07:01:50Z

这种加密（简易替换加密）很容易收到统计学方法的攻击。
比如说，如果你传输的的是 ASCII 英文文档，我们已经知道，英文中最常出现的字母是 e，最常出现的单词是 the，那么攻击者可以统计你发送的报文中出现频率最高的字节和连续三字节，这个很可能就 e 和 the 对应的密文，攻击者就可以根据对应关系解出密钥了。

lenovobenben · 2017-12-30T13:07:00Z

同意 @QuantumGhost ，这样的加密太LOW。
SS/SSR 不知道高到哪里去

argb · 2018-01-01T14:46:31Z

@lenovobenben 其实我觉得这篇文章的意义并不是在于具体的加密算法有多么高级，而是让大家知道了翻墙的原理和一些基本细节。对这方面不太了解的人确实不太懂shadowsocks做了什么，只知道是个代理，有时候也会想为啥不能用nginx走https搞个代理搞定呢？对了，为啥？哈哈。 @wanghanfeng

lenovobenben · 2018-01-02T05:19:14Z

@argb ，原文中这句话，我看了觉得很不合适：
目前采用对称加密算法实现数据混淆的 Shadowsocks 已经能被一些防火墙通过机器学习算法通过特征分析识别出传输的原内容适合合法，而 Lightsocks 的这套混淆算法目前还不能被轻易的识别出来。

这个算法连IV都没有！第一个字节就是 addrType。事实上，我随便写一个脚本都能识别出来，太 easy了。这也叫“不能被轻易识别？”

argb · 2018-01-02T19:15:53Z

@lenovobenben 恩这方面我不是很懂可以跟作者建议或者讨论下

XiaoFaye · 2018-01-18T07:58:10Z

mark

aiibskyler · 2018-01-26T06:25:03Z

hmm，持续关注

WANG-lp · 2018-02-10T09:07:49Z

这个算法连简单的rc4都不如。另外通过统计学方法可以很快的反推出码表，而且可以很容易playback attack.

另外我举一个简单的例子，这个协议中client直接将socks5进行 “混淆” 后发给server端，攻击者只需要修改握手数据包中第四个byte （ATYP）然后重复发送给服务器，通过判断服务器是否立即关闭链接，如果服务器在3种情况下（对应未加密时的0x01, 0x03, 0x04）没有立即关闭链接，那么这个就可以判定是一个私有协议的socks5代理。注意这种方式不需要知道码表，只需要判断是否有3种情况没有立即关闭链接即可。这种方式对于gfw来说简单高效，只需要尝试256种情况。参见：http://stackissue.com/breakwa11/shadowsocks-rss/shadowsocks-38.html

另外我提到的这些东西在ss的演进中都已经讨论过了，希望大家造轮子的时候先多多提高自己的知识水平。

lenovobenben · 2018-02-21T10:23:57Z

@WANG-lp
确实是这样的。这里小白太多，懒得说

imnewbe · 2018-02-24T09:25:32Z

难道这篇文章的目的不是为了告诉你怎么去实现一个 ss功能类似的软件吗。。

Doracoin · 2018-03-02T06:19:16Z

文章思路介绍的很清楚，也从楼上的分享中学习了很多，感谢

fankeke · 2018-03-02T06:40:29Z

赞！
作者是想告诉我们ss的原理以及如何实现一个简单的ss，核心点并不在于加密或者可靠性。

PutinYpa · 2018-03-23T01:27:49Z

大神能分析一下brook的表现如何？

riverlow · 2018-03-28T12:00:15Z

非常感谢!

euphrat1ca · 2018-04-04T09:03:28Z

good luck!

CURAS · 2018-04-09T06:42:32Z

@antonchen 你所说的“v2ray使用的WebSocket协议”是v2ray服务器与其客户端之间的通信协议，客户端与本地需要代理的应用之间仍然是通常使用socks5协议通信的。

catwithtudou · 2020-08-26T02:54:12Z

mark

trybounds · 2020-10-17T17:02:53Z

to avoid the strict firewall, the final solution is tcp/udp over https !
but, why a so small site handled a lot of bit flow?

Ha Ha Ha, so only god is god...

trybounds · 2020-10-25T12:31:33Z

bitf.at

bits traffic plan.

zhengkai · 2021-02-02T02:56:44Z

这个算法连简单的rc4都不如。另外通过统计学方法可以很快的反推出码表，而且可以很容易playback attack.

另外我举一个简单的例子，这个协议中client直接将socks5进行 “混淆” 后发给server端，攻击者只需要修改握手数据包中第四个byte （ATYP）然后重复发送给服务器，通过判断服务器是否立即关闭链接，如果服务器在3种情况下（对应未加密时的0x01, 0x03, 0x04）没有立即关闭链接，那么这个就可以判定是一个私有协议的socks5代理。注意这种方式不需要知道码表，只需要判断是否有3种情况没有立即关闭链接即可。这种方式对于gfw来说简单高效，只需要尝试256种情况。参见：http://stackissue.com/breakwa11/shadowsocks-rss/shadowsocks-38.html

另外我提到的这些东西在ss的演进中都已经讨论过了，希望大家造轮子的时候先多多提高自己的知识水平。

最近老是能看到这种“重新发明”的事情，密码表是古典密码学的范畴，已经被使用了几千年，德军的密码表要比这复杂得多（这个是一个密码表不会变，德军那个是频繁跳表的），但是第一台计算机发明之前就可以破解了。

我以为稍微懂点加密常识的人就能指出问题，结果这项目都有 3.4k star、 6 个 contributor 了，真牛逼。不过也说明了，加密确实很难懂，既然连这种在密码学里连加法都算不上的基础知识都能挡住这么多人

还好，看到你这贴有 57 个赞，我起码有了个底

Quandong-Zhang · 2021-02-05T03:24:22Z

穿墙的解释不太对吧，https 也加密的，为什么访问不了 google/twitter

VPN也是加密的。
原因大概跟VPN翻墙不稳定差不多吧。（特征太明显？）

xinlake · 2021-02-17T04:22:37Z

原理不复杂，实现另外一套流量加密转发机制不难。我觉得难得是让大家接受，代表先进，成为一个标准的过程。

shadowsocks 设计的流量加密环节用到都是广泛认可的技术，能量、时间消耗肯定是增加的，任何加密都会有这个问题，另外设计一套试错的过程肯定会很长。朝着正面的方向看，native 层代码适配硬件加速（CPU 计算能力）及优化代码我觉得是正事。

apuppy · 2021-05-10T03:39:27Z

真不错

LoseNine · 2021-05-21T06:22:28Z

一帮rz，作者在教你们怎么制作，你们说加密太简单

xinlake · 2021-05-21T10:03:52Z

一帮rz，作者在教你们怎么制作，你们说加密太简单

能讲加密简单，基本也懂原理和实现吧

LoseNine · 2021-05-22T01:57:57Z

你说的不错，不过首先需要明白的是这篇文章写作的目的和存在的意义，它可以让一个零基础的人明白Shadowsocks 的基本原理，做出一个不错的替代品。

说加密太低级，甚至爬楼看到的修改ATYP达到攻击目的，如果是站在一个做补充和优化的立场上，无疑是值得敬佩的，他们在改进这个初级的玩具。

但评论中抨击的字眼随处可见，他们想当然地把这篇文章中制作的穿墙工具比肩成品，比如
这样的加密太LOW
希望大家造轮子的时候先多多提高自己的知识水平
这个算法连IV都没有！第一个字节就是 addrType。事实上，我随便写一个脚本都能识别出来，太 easy了......

这让我不得不骂一声jerk

cxwx · 2021-06-27T15:06:03Z

对称加密的方式本来就不是为了安全，楼上哪来那么多秀优越感的的人。

qiaocco · 2021-06-28T14:37:39Z

我把local和server启动后，运行curl --socks5 0.0.0.0:1081 http://mgs.qiaocco.com，server报错：

// 只支持版本5
if err != nil || buf[0] != 0x05 {
return
}

这里版本是0xd8，我这样测试不对吗？

olivetree123 · 2021-07-15T06:37:04Z

有一个地方不太懂啊，如果目标端口是443，那么连接真正的远程服务难道不需要使用ssl吗？

nklongyi · 2021-08-13T05:44:37Z

楼主这样的内容多出一点，很是受教……

activeliang · 2021-09-15T04:07:19Z

有一个地方不太懂啊，如果目标端口是443，那么连接真正的远程服务难道不需要使用ssl吗？

简单了解一下connect的连接原理，可以解决你的疑问

aLavaGolem · 2022-03-26T08:45:11Z

穿墙的解释不太对吧，https 也加密的，为什么访问不了 google/twitter

https开启了通道加密了数据，连接ip和端口都没加密

matisse510 · 2022-03-26T08:45:47Z

已收到，谢谢！

himawarl · 2022-04-07T13:42:21Z

思路挺好的,学习了

andyx719 · 2022-07-01T01:39:12Z

to avoid the strict firewall, the final solution is tcp/udp over https ! but, why a so small site handled a lot of bit flow?

Ha Ha Ha, so only god is god...

do you got a better idea ?

matisse510 · 2022-07-01T01:39:36Z

已收到，谢谢！

braincircuits · 2022-10-11T18:13:34Z

我自己用Java写了一个http代理，寻思好歹自己加一个密，然后介于tcp的有序性，就想到了和楼主一样的想法。
不过看了评论后，我想到了，更进一步的加密，
因为tcp的有序，所以可以准备大量的-128-127的映射，第一个字节用A映射，第二个字节用B映射，第三个字节用C映射。那么不就解决了上面所有的难题吗？

braincircuits · 2022-11-09T17:34:16Z

继上次的多个map映射，我又产生了跟map映射一样效果的做法。
首先给任意准备一个比较小的文件，为什么要比较小？因为要加载这个文件，要是几个G内存就炸了。。。
所以我产生了一个想法，那就是客户端读取一个1000字节的key文件为byte数组，而tcp是有序的，所以借助tcp的有序性，将发送的数据(发送的数据也是一个byte数组)，与key的byte数组进行循环相加，然后将相加后的数据发送给服务端，服务端进行循环相减。
为了避免楼上虚荣心报表的人冷嘲热讽说，哎呀呀，你这个也还是有规律的啊，1000就是一个循环，这个也是可以容易解决的，比如简单一点的，准备一个long变量=0，前面循环相加时，这个 long变量就自增一，且将参与上面的循环相加。也就解决了1000的循环规律。

网络数据千千万，防火墙怎么可能分析的过来？那怕是最基本的发送端每个字节加一，服务端每个字节减一，我赌防火墙也不会认识。

matisse510 · 2022-11-09T17:34:37Z

已收到，谢谢！

aprilweet · 2023-02-08T04:33:42Z

@lenovobenben 其实我觉得这篇文章的意义并不是在于具体的加密算法有多么高级，而是让大家知道了翻墙的原理和一些基本细节。对这方面不太了解的人确实不太懂shadowsocks做了什么，只知道是个代理，有时候也会想为啥不能用nginx走https搞个代理搞定呢？对了，为啥？哈哈。 @wanghanfeng

主要是https比较麻烦吧，需要域名证书这些

wushengtao · 2023-08-21T16:37:29Z

为什么密钥的这个数组中第I个的值不能等于I；

matisse510 · 2023-08-21T16:37:54Z

已收到，谢谢！

dddkkk01 · 2024-04-12T03:25:22Z

继上次的多个map映射，我又产生了跟map映射一样效果的做法。首先给任意准备一个比较小的文件，为什么要比较小？因为要加载这个文件，要是几个G内存就炸了。。。所以我产生了一个想法，那就是客户端读取一个1000字节的key文件为byte数组，而tcp是有序的，所以借助tcp的有序性，将发送的数据(发送的数据也是一个byte数组)，与key的byte数组进行循环相加，然后将相加后的数据发送给服务端，服务端进行循环相减。为了避免楼上虚荣心报表的人冷嘲热讽说，哎呀呀，你这个也还是有规律的啊，1000就是一个循环，这个也是可以容易解决的，比如简单一点的，准备一个long变量=0，前面循环相加时，这个 long变量就自增一，且将参与上面的循环相加。也就解决了1000的循环规律。

网络数据千千万，防火墙怎么可能分析的过来？那怕是最基本的发送端每个字节加一，服务端每个字节减一，我赌防火墙也不会认识。

你说的也没错，其实防火墙的策略是比较复杂的。虽然有重放攻击，但是如果一千人个人用一千种不同的实现手段，除非你涉及了非常敏感的问题，或者被大规模使用，基本上可以安全的使用。
防火墙是带机器学习的，可以根据封特征流量、封端口、封ip、封ip段逐级升级，所以现在过防火墙的软件设计的侧重点也不一样。
对于机场来说，它们有两个侧重点，一个是稳定但是流量可以不用太大，保证轻度使用的客户可以稳定的使用；
其二是对延迟、速度、流量有追求的客户，这类客户用的策略也是不一样的。
但是都使用了类似ip池的技术，确保每个代理服务器的流量都不要太大，毕竟如果你不是知名网站，流量还巨大本身就是特征。
基于这点，必须伪装为网站。对于轻量客户走https，对延迟敏感的客户，可以走tcp、http，透过大量服务器均摊每个服务器的整体流量。
那对于个人来说，流量一般都不大，所以总流量或者瞬时流量这个特征一般不需要考虑。
加密和伪装必须考虑，通道用http或者https都可以。
测试下来，http其实还可以，尤其是自建梯子。
尽量不用非http和https的端口，同时控制流量，不要很长时间不用，然后突然下载几十GB，容易被短暂的限速、封端口和ip。

matisse510 · 2024-04-12T03:26:01Z

已收到，谢谢！

gwuhaolin added the 网络 label Nov 3, 2017

gwuhaolin added a commit to gwuhaolin/lightsocks that referenced this issue Nov 5, 2017

docs: link 实现原理

4e52432

gwuhaolin/blog#12

gwuhaolin mentioned this issue Nov 5, 2017

其它语言的实现？ gwuhaolin/lightsocks#28

Open

This was referenced May 14, 2022

请求添加shadowsocks客户端支持 e1732a364fed/v2ray_simple#80

Closed

[Feature Request]vless v1 的内层加密 e1732a364fed/v2ray_simple#90

Open

你也能写个 Shadowsocks #12

你也能写个 Shadowsocks #12

Comments

gwuhaolin commented Nov 3, 2017 • edited

认识 Shadowsocks

Shadowsocks 原理

ss-local

ss-server

SOCKS5 协议介绍

建立连接

响应连接

和目标服务建立连接

数据转发

总结

Lightsocks 实现

实现数据混淆

实现 local 端

实现 server 端

kalasoo commented Nov 6, 2017

rickytan commented Nov 29, 2017 • edited

mhlau233 commented Dec 3, 2017

antonchen commented Dec 6, 2017

lenovobenben commented Dec 9, 2017

ccsexyz commented Dec 9, 2017

timqian commented Dec 9, 2017

antonchen commented Dec 9, 2017

timqian commented Dec 9, 2017

antonchen commented Dec 9, 2017

wanghanfeng commented Dec 20, 2017

QuantumGhost commented Dec 30, 2017

lenovobenben commented Dec 30, 2017

argb commented Jan 1, 2018

lenovobenben commented Jan 2, 2018

argb commented Jan 2, 2018

XiaoFaye commented Jan 18, 2018

aiibskyler commented Jan 26, 2018

WANG-lp commented Feb 10, 2018 • edited

lenovobenben commented Feb 21, 2018

imnewbe commented Feb 24, 2018

Doracoin commented Mar 2, 2018

fankeke commented Mar 2, 2018

PutinYpa commented Mar 23, 2018

riverlow commented Mar 28, 2018

euphrat1ca commented Apr 4, 2018

CURAS commented Apr 9, 2018

catwithtudou commented Aug 26, 2020

trybounds commented Oct 17, 2020

trybounds commented Oct 25, 2020 • edited

zhengkai commented Feb 2, 2021

Quandong-Zhang commented Feb 5, 2021

xinlake commented Feb 17, 2021 • edited

apuppy commented May 10, 2021

LoseNine commented May 21, 2021

xinlake commented May 21, 2021

LoseNine commented May 22, 2021

cxwx commented Jun 27, 2021

qiaocco commented Jun 28, 2021

olivetree123 commented Jul 15, 2021

nklongyi commented Aug 13, 2021

activeliang commented Sep 15, 2021

aLavaGolem commented Mar 26, 2022

matisse510 commented Mar 26, 2022 via email

himawarl commented Apr 7, 2022

andyx719 commented Jul 1, 2022

matisse510 commented Jul 1, 2022 via email

braincircuits commented Oct 11, 2022

braincircuits commented Nov 9, 2022

matisse510 commented Nov 9, 2022 via email

aprilweet commented Feb 8, 2023

wushengtao commented Aug 21, 2023

matisse510 commented Aug 21, 2023 via email

dddkkk01 commented Apr 12, 2024

matisse510 commented Apr 12, 2024 via email

gwuhaolin commented Nov 3, 2017 •

edited

rickytan commented Nov 29, 2017 •

edited

WANG-lp commented Feb 10, 2018 •

edited

trybounds commented Oct 25, 2020 •

edited

xinlake commented Feb 17, 2021 •

edited