1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

squared hinge loss,有时也会用,在有些数据上表现好

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

negative one over number of classes

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

选择正好能在内存中放下的batchsize,这里还要再听一下,1:00:00左右

66

67

68

69

70

71

72

73

74

没看懂

75

76


In [ ]: