查看: 3001|回复: 0

[Mysql数据库] 使用keras做SQL注入攻击的判断(实例讲解)

发表于 2018-3-27 08:00:00

本文是通过深度学习框架keras来做SQL注入特征识别, 不过虽然用了keras,但是大部分还是普通的神经网络,只是外加了一些规则化、dropout层(随着深度学习出现的层)。

基本思路就是喂入一堆数据(INT型)、通过神经网络计算(正向、反向)、SOFTMAX多分类概率计算得出各个类的概率,注意:这里只要2个类别:0-正常的文本;1-包含SQL注入的文本

文件分割上,做成了4个python文件:

util类,用来将char转换成int(NN要的都是数字类型的,其他任何类型都要转换成int/float这些才能喂入,又称为feed)

data类,用来获取训练数据,验证数据的类,由于这里的训练是有监督训练,因此此时需要返回的是个元组(x, y)

trainer类,keras的网络模型建模在这里,包括损失函数、训练epoch次数等

predict类,获取几个测试数据,看看效果的预测类

先放trainer类代码,网络定义在这里,最重要的一个,和数据格式一样重要(呵呵,数据格式可是非常重要的,在这种程序中)

  1. import SQL注入Data
  2. import numpy as np
  3. import keras
  4. from keras.models import Sequential
  5. from keras.layers import Dense, Dropout, Activation
  6. from keras.layers.normalization import BatchNormalization
  7. from keras.optimizers import SGD
  8. x, y=SQL注入Data.loadSQLInjectData()
  9. availableVectorSize=15
  10. x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=availableVectorSize)
  11. y=keras.utils.to_categorical(y, num_classes=2)
  12. model = Sequential()
  13. model.add(Dense(64, activation='relu', input_dim=availableVectorSize))
  14. model.add(BatchNormalization())
  15. model.add(Dropout(0.3))
  16. model.add(Dense(64, activation='relu'))
  17. model.add(Dropout(0.3))
  18. model.add(Dense(2, activation='softmax'))
  19. sgd = SGD(lr=0.001, momentum=0.9)
  20. model.compile(loss='mse',
  21. optimizer=sgd,
  22. metrics=['accuracy'])
  23. history=model.fit(x, y,epochs=500,batch_size=16)
  24. model.save('E:\\sql_checker\\models\\trained_models.h5')
  25. print("DONE, model saved in path-->E:\\sql_checker\\models\\trained_models.h5")
  26. import matplotlib.pyplot as plt
  27. plt.plot(history.history['loss'])
  28. plt.title('model loss')
  29. plt.ylabel('loss')
  30. plt.xlabel('epoch')
  31. plt.legend(['train', 'test'], loc='upper left')
  32. plt.show()
复制代码

先来解释上面这段plt的代码,因为最容易解释,这段代码是用来把每次epoch的训练的损失loss value用折线图表示出来:

  

何为训练?何为损失loss value?

训练的目的是为了想让网络最终计算出来的分类数据和我们给出的y一致,那不一致怎么算?不一致就是有损失,也就是说训练的目的是要一致,也就是要损失最小化

怎么让损失最小化?梯度下降,这里用的是SGD优化算法:

  1. from keras.optimizers import SGD
  2. sgd = SGD(lr=0.001, momentum=0.9)
  3. model.compile(loss='mse',
  4. optimizer=sgd,
  5. metrics=['accuracy'])
复制代码

上面这段代码的loss='mse'就是定义了用那种损失函数,还有好几种损失函数,大家自己参考啊。

optimizer=sgd就是优化算法用哪个了,不同的optimizer有不同的参数

由于此处用的是全连接NN,因此是需要固定的输入size的,这个函数就是用来固定(不够会补0) 特征向量size的:

  1. x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=availableVectorSize)
复制代码

再来看看最终的分类输出,是one hot的,这个one hot大家自己查查,很容易的定义,就是比较浪费空间,分类间没有关联性,不过用在这里很方便

  1. y=keras.utils.to_categorical(y, num_classes=2)
复制代码

然后再说说预测部分代码:

  1. import SQL注入Data
  2. import Converter
  3. import numpy as np
  4. import keras
  5. from keras.models import load_model
  6. print("predict....")
  7. x=SQL注入Data.loadTestSQLInjectData()
  8. x=keras.preprocessing.sequence.pad_sequences(x, padding='post', maxlen=15)
  9. model=load_model('E:\\sql_checker\\models\\trained_models.h5')
  10. result=model.predict_classes(x, batch_size=len(x))
  11. result=Converter.convert2label(result)
  12. print(result)
  13. print("DONE")
复制代码

这部分代码很容易理解,并且连y都没有  

  

好了,似乎有那么点意思了吧。

下面把另外几个工具类、数据类代码放出来:

  1. def toints(sentence):
  2. base=ord('0')
  3. ary=[]
  4. for c in sentence:
  5. ary.append(ord(c)-base)
  6. return ary
  7. def convert2label(vector):
  8. string_array=[]
  9. for v in vector:
  10. if v==1:
  11. string_array.append('SQL注入')
  12. else:
  13. string_array.append('正常文本')
  14. return string_array
复制代码
  1. import Converter
  2. import numpy as np
  3. def loadSQLInjectData():
  4. x=[]
  5. x.append(Converter.toints("100"))
  6. x.append(Converter.toints("150"))
  7. x.append(Converter.toints("1"))
  8. x.append(Converter.toints("3"))
  9. x.append(Converter.toints("19"))
  10. x.append(Converter.toints("37"))
  11. x.append(Converter.toints("1'--"))
  12. x.append(Converter.toints("1' or 1=1;--"))
  13. x.append(Converter.toints("updatable"))
  14. x.append(Converter.toints("update tbl"))
  15. x.append(Converter.toints("update someb"))
  16. x.append(Converter.toints("update"))
  17. x.append(Converter.toints("updat"))
  18. x.append(Converter.toints("update a"))
  19. x.append(Converter.toints("'--"))
  20. x.append(Converter.toints("' or 1=1;--"))
  21. x.append(Converter.toints("aupdatable"))
  22. x.append(Converter.toints("hello world"))
  23. y=[[0],[0],[0],[0],[0],[0],[1],[1],[0],[1],[1],[0],[0],[1],[1],[1],[0],[0]]
  24. x=np.asarray(x)
  25. y=np.asarray(y)
  26. return x, y
  27. def loadTestSQLInjectData():
  28. x=[]
  29. x.append(Converter.toints("some value"))
  30. x.append(Converter.toints("-1"))
  31. x.append(Converter.toints("' or 1=1;--"))
  32. x.append(Converter.toints("noupdate"))
  33. x.append(Converter.toints("update "))
  34. x.append(Converter.toints("update"))
  35. x.append(Converter.toints("update z"))
  36. x=np.asarray(x)
  37. return x
复制代码

以上这篇使用keras做SQL注入攻击的判断(实例讲解)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持程序员之家。



回复

使用道具 举报