Compare commits
6 Commits
Author | SHA1 | Date | |
---|---|---|---|
58f0560042 | |||
61ec427a30 | |||
e4d5a1be76 | |||
c194bec3e3 | |||
fadacd18ce | |||
4bd8e8ce33 |
1
.gitignore
vendored
1
.gitignore
vendored
@ -8,3 +8,4 @@
|
|||||||
*test.json
|
*test.json
|
||||||
*.txt
|
*.txt
|
||||||
dist
|
dist
|
||||||
|
xtest
|
2
go.mod
2
go.mod
@ -7,7 +7,6 @@ require (
|
|||||||
github.com/elastic/go-elasticsearch/v7 v7.17.10
|
github.com/elastic/go-elasticsearch/v7 v7.17.10
|
||||||
github.com/fatih/color v1.16.0
|
github.com/fatih/color v1.16.0
|
||||||
github.com/samber/lo v1.39.0
|
github.com/samber/lo v1.39.0
|
||||||
github.com/sirupsen/logrus v1.9.3
|
|
||||||
github.com/spf13/cobra v1.8.0
|
github.com/spf13/cobra v1.8.0
|
||||||
)
|
)
|
||||||
|
|
||||||
@ -16,7 +15,6 @@ require (
|
|||||||
github.com/mattn/go-colorable v0.1.13 // indirect
|
github.com/mattn/go-colorable v0.1.13 // indirect
|
||||||
github.com/mattn/go-isatty v0.0.20 // indirect
|
github.com/mattn/go-isatty v0.0.20 // indirect
|
||||||
github.com/spf13/pflag v1.0.5 // indirect
|
github.com/spf13/pflag v1.0.5 // indirect
|
||||||
github.com/stretchr/testify v1.8.4 // indirect
|
|
||||||
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17 // indirect
|
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17 // indirect
|
||||||
golang.org/x/sys v0.14.0 // indirect
|
golang.org/x/sys v0.14.0 // indirect
|
||||||
)
|
)
|
||||||
|
14
go.sum
14
go.sum
@ -1,7 +1,4 @@
|
|||||||
github.com/cpuguy83/go-md2man/v2 v2.0.3/go.mod h1:tgQtvFlXSQOSOSIRvRPT7W67SCa46tRHOmNcaadrF8o=
|
github.com/cpuguy83/go-md2man/v2 v2.0.3/go.mod h1:tgQtvFlXSQOSOSIRvRPT7W67SCa46tRHOmNcaadrF8o=
|
||||||
github.com/davecgh/go-spew v1.1.0/go.mod h1:J7Y8YcW2NihsgmVo/mv3lAwl/skON4iLHjSsI+c5H38=
|
|
||||||
github.com/davecgh/go-spew v1.1.1 h1:vj9j/u1bqnvCEfJOwUhtlOARqs3+rkHYY13jYWTU97c=
|
|
||||||
github.com/davecgh/go-spew v1.1.1/go.mod h1:J7Y8YcW2NihsgmVo/mv3lAwl/skON4iLHjSsI+c5H38=
|
|
||||||
github.com/elastic/go-elasticsearch/v6 v6.8.10 h1:2lN0gJ93gMBXvkhwih5xquldszpm8FlUwqG5sPzr6a8=
|
github.com/elastic/go-elasticsearch/v6 v6.8.10 h1:2lN0gJ93gMBXvkhwih5xquldszpm8FlUwqG5sPzr6a8=
|
||||||
github.com/elastic/go-elasticsearch/v6 v6.8.10/go.mod h1:UwaDJsD3rWLM5rKNFzv9hgox93HoX8utj1kxD9aFUcI=
|
github.com/elastic/go-elasticsearch/v6 v6.8.10/go.mod h1:UwaDJsD3rWLM5rKNFzv9hgox93HoX8utj1kxD9aFUcI=
|
||||||
github.com/elastic/go-elasticsearch/v7 v7.17.10 h1:TCQ8i4PmIJuBunvBS6bwT2ybzVFxxUhhltAs3Gyu1yo=
|
github.com/elastic/go-elasticsearch/v7 v7.17.10 h1:TCQ8i4PmIJuBunvBS6bwT2ybzVFxxUhhltAs3Gyu1yo=
|
||||||
@ -15,29 +12,18 @@ github.com/mattn/go-colorable v0.1.13/go.mod h1:7S9/ev0klgBDR4GtXTXX8a3vIGJpMovk
|
|||||||
github.com/mattn/go-isatty v0.0.16/go.mod h1:kYGgaQfpe5nmfYZH+SKPsOc2e4SrIfOl2e/yFXSvRLM=
|
github.com/mattn/go-isatty v0.0.16/go.mod h1:kYGgaQfpe5nmfYZH+SKPsOc2e4SrIfOl2e/yFXSvRLM=
|
||||||
github.com/mattn/go-isatty v0.0.20 h1:xfD0iDuEKnDkl03q4limB+vH+GxLEtL/jb4xVJSWWEY=
|
github.com/mattn/go-isatty v0.0.20 h1:xfD0iDuEKnDkl03q4limB+vH+GxLEtL/jb4xVJSWWEY=
|
||||||
github.com/mattn/go-isatty v0.0.20/go.mod h1:W+V8PltTTMOvKvAeJH7IuucS94S2C6jfK/D7dTCTo3Y=
|
github.com/mattn/go-isatty v0.0.20/go.mod h1:W+V8PltTTMOvKvAeJH7IuucS94S2C6jfK/D7dTCTo3Y=
|
||||||
github.com/pmezard/go-difflib v1.0.0 h1:4DBwDE0NGyQoBHbLQYPwSUPoCMWR5BEzIk/f1lZbAQM=
|
|
||||||
github.com/pmezard/go-difflib v1.0.0/go.mod h1:iKH77koFhYxTK1pcRnkKkqfTogsbg7gZNVY4sRDYZ/4=
|
|
||||||
github.com/russross/blackfriday/v2 v2.1.0/go.mod h1:+Rmxgy9KzJVeS9/2gXHxylqXiyQDYRxCVz55jmeOWTM=
|
github.com/russross/blackfriday/v2 v2.1.0/go.mod h1:+Rmxgy9KzJVeS9/2gXHxylqXiyQDYRxCVz55jmeOWTM=
|
||||||
github.com/samber/lo v1.39.0 h1:4gTz1wUhNYLhFSKl6O+8peW0v2F4BCY034GRpU9WnuA=
|
github.com/samber/lo v1.39.0 h1:4gTz1wUhNYLhFSKl6O+8peW0v2F4BCY034GRpU9WnuA=
|
||||||
github.com/samber/lo v1.39.0/go.mod h1:+m/ZKRl6ClXCE2Lgf3MsQlWfh4bn1bz6CXEOxnEXnEA=
|
github.com/samber/lo v1.39.0/go.mod h1:+m/ZKRl6ClXCE2Lgf3MsQlWfh4bn1bz6CXEOxnEXnEA=
|
||||||
github.com/sirupsen/logrus v1.9.3 h1:dueUQJ1C2q9oE3F7wvmSGAaVtTmUizReu6fjN8uqzbQ=
|
|
||||||
github.com/sirupsen/logrus v1.9.3/go.mod h1:naHLuLoDiP4jHNo9R0sCBMtWGeIprob74mVsIT4qYEQ=
|
|
||||||
github.com/spf13/cobra v1.8.0 h1:7aJaZx1B85qltLMc546zn58BxxfZdR/W22ej9CFoEf0=
|
github.com/spf13/cobra v1.8.0 h1:7aJaZx1B85qltLMc546zn58BxxfZdR/W22ej9CFoEf0=
|
||||||
github.com/spf13/cobra v1.8.0/go.mod h1:WXLWApfZ71AjXPya3WOlMsY9yMs7YeiHhFVlvLyhcho=
|
github.com/spf13/cobra v1.8.0/go.mod h1:WXLWApfZ71AjXPya3WOlMsY9yMs7YeiHhFVlvLyhcho=
|
||||||
github.com/spf13/pflag v1.0.5 h1:iy+VFUOCP1a+8yFto/drg2CJ5u0yRoB7fZw3DKv/JXA=
|
github.com/spf13/pflag v1.0.5 h1:iy+VFUOCP1a+8yFto/drg2CJ5u0yRoB7fZw3DKv/JXA=
|
||||||
github.com/spf13/pflag v1.0.5/go.mod h1:McXfInJRrz4CZXVZOBLb0bTZqETkiAhM9Iw0y3An2Bg=
|
github.com/spf13/pflag v1.0.5/go.mod h1:McXfInJRrz4CZXVZOBLb0bTZqETkiAhM9Iw0y3An2Bg=
|
||||||
github.com/stretchr/objx v0.1.0/go.mod h1:HFkY916IF+rwdDfMAkV7OtwuqBVzrE8GR6GFx+wExME=
|
|
||||||
github.com/stretchr/testify v1.7.0/go.mod h1:6Fq8oRcR53rry900zMqJjRRixrwX3KX962/h/Wwjteg=
|
|
||||||
github.com/stretchr/testify v1.8.4 h1:CcVxjf3Q8PM0mHUKJCdn+eZZtm5yQwehR5yeSVQQcUk=
|
|
||||||
github.com/stretchr/testify v1.8.4/go.mod h1:sz/lmYIOXD/1dqDmKjjqLyZ2RngseejIcXlSw2iwfAo=
|
|
||||||
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17 h1:3MTrJm4PyNL9NBqvYDSj3DHl46qQakyfqfWo4jgfaEM=
|
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17 h1:3MTrJm4PyNL9NBqvYDSj3DHl46qQakyfqfWo4jgfaEM=
|
||||||
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17/go.mod h1:lgLbSvA5ygNOMpwM/9anMpWVlVJ7Z+cHWq/eFuinpGE=
|
golang.org/x/exp v0.0.0-20220303212507-bbda1eaf7a17/go.mod h1:lgLbSvA5ygNOMpwM/9anMpWVlVJ7Z+cHWq/eFuinpGE=
|
||||||
golang.org/x/sys v0.0.0-20220715151400-c0bba94af5f8/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
|
|
||||||
golang.org/x/sys v0.0.0-20220811171246-fbc7d0a398ab/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
|
golang.org/x/sys v0.0.0-20220811171246-fbc7d0a398ab/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
|
||||||
golang.org/x/sys v0.6.0/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
|
golang.org/x/sys v0.6.0/go.mod h1:oPkhp1MJrh7nUepCBck5+mAzfO9JrbApNNgaTdGDITg=
|
||||||
golang.org/x/sys v0.14.0 h1:Vz7Qs629MkJkGyHxUlRHizWJRG2j8fbQKjELVSNhy7Q=
|
golang.org/x/sys v0.14.0 h1:Vz7Qs629MkJkGyHxUlRHizWJRG2j8fbQKjELVSNhy7Q=
|
||||||
golang.org/x/sys v0.14.0/go.mod h1:/VUhepiaJMQUp4+oa/7Zr1D23ma6VTLIYjOOTFZPUcA=
|
golang.org/x/sys v0.14.0/go.mod h1:/VUhepiaJMQUp4+oa/7Zr1D23ma6VTLIYjOOTFZPUcA=
|
||||||
gopkg.in/check.v1 v0.0.0-20161208181325-20d25e280405/go.mod h1:Co6ibVJAznAaIkqp8huTwlJQCZ016jof/cbN4VW5Yz0=
|
gopkg.in/check.v1 v0.0.0-20161208181325-20d25e280405/go.mod h1:Co6ibVJAznAaIkqp8huTwlJQCZ016jof/cbN4VW5Yz0=
|
||||||
gopkg.in/yaml.v3 v3.0.0-20200313102051-9f266ea9e77c/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
|
|
||||||
gopkg.in/yaml.v3 v3.0.1 h1:fxVm/GzAzEWqLHuvctI91KS9hhNmmWOoWu0XTYJS7CA=
|
|
||||||
gopkg.in/yaml.v3 v3.0.1/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
|
gopkg.in/yaml.v3 v3.0.1/go.mod h1:K4uyk7z7BCEPqu6E+C64Yfv1cQ7kz7rIZviUmN+EgEM=
|
||||||
|
@ -6,7 +6,8 @@ import (
|
|||||||
"encoding/json"
|
"encoding/json"
|
||||||
"errors"
|
"errors"
|
||||||
"fmt"
|
"fmt"
|
||||||
"github.com/loveuer/esgo2dump/internal/log"
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
"net/url"
|
"net/url"
|
||||||
"os"
|
"os"
|
||||||
"strings"
|
"strings"
|
||||||
@ -16,7 +17,6 @@ import (
|
|||||||
"github.com/loveuer/esgo2dump/internal/xes"
|
"github.com/loveuer/esgo2dump/internal/xes"
|
||||||
"github.com/loveuer/esgo2dump/internal/xfile"
|
"github.com/loveuer/esgo2dump/internal/xfile"
|
||||||
"github.com/samber/lo"
|
"github.com/samber/lo"
|
||||||
"github.com/sirupsen/logrus"
|
|
||||||
"github.com/spf13/cobra"
|
"github.com/spf13/cobra"
|
||||||
)
|
)
|
||||||
|
|
||||||
@ -51,9 +51,7 @@ func run(cmd *cobra.Command, args []string) error {
|
|||||||
)
|
)
|
||||||
|
|
||||||
if opt.Debug {
|
if opt.Debug {
|
||||||
logrus.SetLevel(logrus.DebugLevel)
|
log.SetLogLevel(log.LogLevelDebug)
|
||||||
logrus.SetReportCaller(true)
|
|
||||||
logrus.SetFormatter(&logrus.JSONFormatter{})
|
|
||||||
}
|
}
|
||||||
|
|
||||||
if f_version {
|
if f_version {
|
||||||
@ -129,8 +127,6 @@ func run(cmd *cobra.Command, args []string) error {
|
|||||||
func executeData(ctx context.Context, input, output interfaces.DumpIO) error {
|
func executeData(ctx context.Context, input, output interfaces.DumpIO) error {
|
||||||
var (
|
var (
|
||||||
err error
|
err error
|
||||||
ch = make(chan []*interfaces.ESSource, 1)
|
|
||||||
errCh = make(chan error)
|
|
||||||
queries = make([]map[string]any, 0)
|
queries = make([]map[string]any, 0)
|
||||||
sources = make([]string, 0)
|
sources = make([]string, 0)
|
||||||
)
|
)
|
||||||
@ -188,86 +184,56 @@ func executeData(ctx context.Context, input, output interfaces.DumpIO) error {
|
|||||||
queries = append(queries, nil)
|
queries = append(queries, nil)
|
||||||
}
|
}
|
||||||
|
|
||||||
go func(c context.Context) {
|
|
||||||
var (
|
var (
|
||||||
lines []*interfaces.ESSource
|
ok bool
|
||||||
|
docs []*model.ESSource
|
||||||
|
dch <-chan []*model.ESSource
|
||||||
|
ech <-chan error
|
||||||
|
|
||||||
|
e2ch = make(chan error)
|
||||||
|
wch = make(chan []*model.ESSource)
|
||||||
)
|
)
|
||||||
|
|
||||||
|
go func() {
|
||||||
defer func() {
|
defer func() {
|
||||||
close(ch)
|
close(wch)
|
||||||
|
close(e2ch)
|
||||||
}()
|
}()
|
||||||
|
|
||||||
Loop:
|
if err = output.WriteData(ctx, wch); err != nil {
|
||||||
|
e2ch <- err
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
log.Info("Query: got queries=%d", len(queries))
|
||||||
|
|
||||||
|
Loop:
|
||||||
for _, query := range queries {
|
for _, query := range queries {
|
||||||
for {
|
dch, ech = input.ReadData(ctx, f_limit, query, sources)
|
||||||
select {
|
|
||||||
case <-c.Done():
|
|
||||||
return
|
|
||||||
default:
|
|
||||||
if lines, err = input.ReadData(c, f_limit, query, sources); err != nil {
|
|
||||||
errCh <- err
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
logrus.
|
|
||||||
WithField("action", "input read data got lines").
|
|
||||||
WithField("lines", len(lines)).
|
|
||||||
Debug()
|
|
||||||
|
|
||||||
if len(lines) == 0 {
|
|
||||||
input.ResetOffset()
|
|
||||||
if query != nil {
|
|
||||||
bs, _ := json.Marshal(query)
|
|
||||||
log.Info("Dump: query_file query=%s read done!!!", string(bs))
|
|
||||||
}
|
|
||||||
continue Loop
|
|
||||||
}
|
|
||||||
|
|
||||||
ch <- lines
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}(ctx)
|
|
||||||
|
|
||||||
var (
|
|
||||||
succeed int
|
|
||||||
total int
|
|
||||||
docs []*interfaces.ESSource
|
|
||||||
ok bool
|
|
||||||
)
|
|
||||||
|
|
||||||
for {
|
for {
|
||||||
select {
|
select {
|
||||||
case <-ctx.Done():
|
case <-ctx.Done():
|
||||||
case err = <-errCh:
|
return ctx.Err()
|
||||||
return err
|
case err, ok = <-ech:
|
||||||
case docs, ok = <-ch:
|
if err != nil {
|
||||||
if !ok {
|
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
if len(docs) == 0 {
|
continue Loop
|
||||||
|
case err, _ = <-e2ch:
|
||||||
|
return err
|
||||||
|
case docs, ok = <-dch:
|
||||||
|
if !ok || len(docs) == 0 {
|
||||||
|
continue Loop
|
||||||
|
}
|
||||||
|
|
||||||
|
wch <- docs
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
return nil
|
return nil
|
||||||
}
|
|
||||||
|
|
||||||
if succeed, err = output.WriteData(ctx, docs); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
logrus.
|
|
||||||
WithField("action", "output wrote data lines").
|
|
||||||
WithField("lines", succeed).
|
|
||||||
Debug()
|
|
||||||
|
|
||||||
if succeed != len(docs) {
|
|
||||||
return fmt.Errorf("output got lines=%d, only succeed=%d", len(docs), succeed)
|
|
||||||
}
|
|
||||||
|
|
||||||
total += succeed
|
|
||||||
|
|
||||||
log.Info("Dump: succeed=%d total=%d docs succeed!!!", succeed, total)
|
|
||||||
}
|
|
||||||
}
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func newIO(source string, ioType interfaces.IO, esv string) (interfaces.DumpIO, error) {
|
func newIO(source string, ioType interfaces.IO, esv string) (interfaces.DumpIO, error) {
|
||||||
@ -278,50 +244,26 @@ func newIO(source string, ioType interfaces.IO, esv string) (interfaces.DumpIO,
|
|||||||
qm = make(map[string]any)
|
qm = make(map[string]any)
|
||||||
)
|
)
|
||||||
|
|
||||||
logrus.
|
log.Debug("action=%s, type=%s, source=%s, es_version=%s", "new_io", ioType.Code(), source, esv)
|
||||||
WithField("action", "new_io").
|
|
||||||
WithField("type", ioType.Code()).
|
|
||||||
WithField("source", source).
|
|
||||||
WithField("es_version", esv).
|
|
||||||
Debug()
|
|
||||||
|
|
||||||
if iurl, err = url.Parse(source); err != nil {
|
if iurl, err = url.Parse(source); err != nil {
|
||||||
logrus.
|
log.Debug("action=%s, type=%s, source=%s, err=%s", "new_io url parse err", ioType.Code(), source, err.Error())
|
||||||
WithField("action", "new_io url parse error").
|
|
||||||
WithField("type", ioType.Code()).
|
|
||||||
WithField("source", source).
|
|
||||||
WithField("err", err).
|
|
||||||
Debug()
|
|
||||||
goto ClientByFile
|
goto ClientByFile
|
||||||
}
|
}
|
||||||
|
|
||||||
if !(iurl.Scheme == "http" || iurl.Scheme == "https") {
|
if !(iurl.Scheme == "http" || iurl.Scheme == "https") {
|
||||||
logrus.
|
log.Debug("action=%s, type=%s, source=%s, scheme=%s", "new_io url scheme error", ioType.Code(), source, iurl.Scheme)
|
||||||
WithField("action", "new_io url scheme error").
|
|
||||||
WithField("type", ioType.Code()).
|
|
||||||
WithField("source", source).
|
|
||||||
WithField("scheme", iurl.Scheme).
|
|
||||||
Debug()
|
|
||||||
goto ClientByFile
|
goto ClientByFile
|
||||||
}
|
}
|
||||||
|
|
||||||
if iurl.Host == "" {
|
if iurl.Host == "" {
|
||||||
logrus.
|
log.Debug("action=%s, type=%s, source=%s", "new_io url host empty", ioType.Code(), source)
|
||||||
WithField("action", "new_io url host empty").
|
|
||||||
WithField("type", ioType.Code()).
|
|
||||||
WithField("source", source).
|
|
||||||
Debug()
|
|
||||||
goto ClientByFile
|
goto ClientByFile
|
||||||
}
|
}
|
||||||
|
|
||||||
if ioType == interfaces.IOInput && f_query != "" {
|
if ioType == interfaces.IOInput && f_query != "" {
|
||||||
if err = json.Unmarshal([]byte(f_query), &qm); err != nil {
|
if err = json.Unmarshal([]byte(f_query), &qm); err != nil {
|
||||||
logrus.
|
log.Debug("action=%s, type=%s, source=%s, query=%s", "new_io query string invalid", ioType.Code(), source, f_query)
|
||||||
WithField("action", "new_io query string invalid").
|
|
||||||
WithField("type", ioType.Code()).
|
|
||||||
WithField("source", source).
|
|
||||||
WithField("query", f_query).
|
|
||||||
Debug()
|
|
||||||
return nil, fmt.Errorf("invalid query err=%v", err)
|
return nil, fmt.Errorf("invalid query err=%v", err)
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
@ -1,12 +1,13 @@
|
|||||||
package interfaces
|
package interfaces
|
||||||
|
|
||||||
import "context"
|
import (
|
||||||
|
"context"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
)
|
||||||
|
|
||||||
type DumpIO interface {
|
type DumpIO interface {
|
||||||
ReadData(ctx context.Context, size int, query map[string]any, includeFields []string) ([]*ESSource, error)
|
ReadData(ctx context.Context, size int, query map[string]any, includeFields []string) (<-chan []*model.ESSource, <-chan error)
|
||||||
WriteData(ctx context.Context, docs []*ESSource) (int, error)
|
WriteData(ctx context.Context, docsCh <-chan []*model.ESSource) error
|
||||||
|
|
||||||
ResetOffset()
|
|
||||||
|
|
||||||
ReadMapping(context.Context) (map[string]any, error)
|
ReadMapping(context.Context) (map[string]any, error)
|
||||||
WriteMapping(context.Context, map[string]any) error
|
WriteMapping(context.Context, map[string]any) error
|
||||||
|
@ -1,43 +0,0 @@
|
|||||||
package log
|
|
||||||
|
|
||||||
import (
|
|
||||||
"bytes"
|
|
||||||
"fmt"
|
|
||||||
"github.com/fatih/color"
|
|
||||||
"sync"
|
|
||||||
"time"
|
|
||||||
)
|
|
||||||
|
|
||||||
var (
|
|
||||||
red = color.New(color.FgRed)
|
|
||||||
green = color.New(color.FgGreen)
|
|
||||||
yellow = color.New(color.FgYellow)
|
|
||||||
|
|
||||||
locker = &sync.Mutex{}
|
|
||||||
|
|
||||||
timeFormat = "06/01/02T15:04:05"
|
|
||||||
)
|
|
||||||
|
|
||||||
func Info(msg string, data ...any) {
|
|
||||||
buf := &bytes.Buffer{}
|
|
||||||
_, _ = green.Fprint(buf, "Info ")
|
|
||||||
_, _ = fmt.Fprintf(buf, "| %s | ", time.Now().Format(timeFormat))
|
|
||||||
_, _ = fmt.Fprintf(buf, msg, data...)
|
|
||||||
fmt.Println(buf.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
func Warn(msg string, data ...any) {
|
|
||||||
buf := &bytes.Buffer{}
|
|
||||||
_, _ = yellow.Fprint(buf, "Warn ")
|
|
||||||
_, _ = fmt.Fprintf(buf, "| %s | ", time.Now().Format(timeFormat))
|
|
||||||
_, _ = fmt.Fprintf(buf, msg, data...)
|
|
||||||
fmt.Println(buf.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
func Error(msg string, data ...any) {
|
|
||||||
buf := &bytes.Buffer{}
|
|
||||||
_, _ = red.Fprint(buf, "Error ")
|
|
||||||
_, _ = fmt.Fprintf(buf, "| %s | ", time.Now().Format(timeFormat))
|
|
||||||
_, _ = fmt.Fprintf(buf, msg, data...)
|
|
||||||
fmt.Println(buf.String())
|
|
||||||
}
|
|
@ -1,371 +0,0 @@
|
|||||||
package xes
|
|
||||||
|
|
||||||
import (
|
|
||||||
"bytes"
|
|
||||||
"context"
|
|
||||||
"crypto/tls"
|
|
||||||
"encoding/json"
|
|
||||||
"fmt"
|
|
||||||
"github.com/loveuer/esgo2dump/internal/log"
|
|
||||||
"net"
|
|
||||||
"net/http"
|
|
||||||
"net/url"
|
|
||||||
"strings"
|
|
||||||
"time"
|
|
||||||
|
|
||||||
elastic "github.com/elastic/go-elasticsearch/v7"
|
|
||||||
"github.com/elastic/go-elasticsearch/v7/esapi"
|
|
||||||
"github.com/elastic/go-elasticsearch/v7/esutil"
|
|
||||||
"github.com/loveuer/esgo2dump/internal/interfaces"
|
|
||||||
"github.com/loveuer/esgo2dump/internal/opt"
|
|
||||||
"github.com/loveuer/esgo2dump/internal/util"
|
|
||||||
"github.com/sirupsen/logrus"
|
|
||||||
)
|
|
||||||
|
|
||||||
func NewClient(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
|
||||||
|
|
||||||
var (
|
|
||||||
address = fmt.Sprintf("%s://%s", url.Scheme, url.Host)
|
|
||||||
urlIndex = strings.TrimPrefix(url.Path, "/")
|
|
||||||
urlUsername string
|
|
||||||
urlPassword string
|
|
||||||
errCh = make(chan error)
|
|
||||||
cliCh = make(chan *elastic.Client)
|
|
||||||
)
|
|
||||||
|
|
||||||
if url.User != nil {
|
|
||||||
urlUsername = url.User.Username()
|
|
||||||
if p, ok := url.User.Password(); ok {
|
|
||||||
urlPassword = p
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
logrus.
|
|
||||||
WithField("action", "new es client v7").
|
|
||||||
WithField("endpoint", address).
|
|
||||||
WithField("index", urlIndex).
|
|
||||||
WithField("username", urlUsername).
|
|
||||||
WithField("password", urlPassword).
|
|
||||||
Debug()
|
|
||||||
|
|
||||||
if urlIndex == "" {
|
|
||||||
return nil, fmt.Errorf("please specify index name: (like => http://127.0.0.1:9200/my_index)")
|
|
||||||
}
|
|
||||||
|
|
||||||
ncFunc := func(endpoints []string, username, password, index string) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
cli *elastic.Client
|
|
||||||
infoResp *esapi.Response
|
|
||||||
)
|
|
||||||
|
|
||||||
if cli, err = elastic.NewClient(
|
|
||||||
elastic.Config{
|
|
||||||
Addresses: endpoints,
|
|
||||||
Username: username,
|
|
||||||
Password: password,
|
|
||||||
CACert: nil,
|
|
||||||
RetryOnStatus: []int{429},
|
|
||||||
MaxRetries: 3,
|
|
||||||
RetryBackoff: nil,
|
|
||||||
Transport: &http.Transport{
|
|
||||||
TLSClientConfig: &tls.Config{InsecureSkipVerify: true},
|
|
||||||
DialContext: (&net.Dialer{Timeout: 10 * time.Second}).DialContext,
|
|
||||||
},
|
|
||||||
},
|
|
||||||
); err != nil {
|
|
||||||
logrus.
|
|
||||||
WithField("action", "new es client v7 error").
|
|
||||||
WithField("endpoints", endpoints).
|
|
||||||
WithField("err", err).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
if infoResp, err = cli.Info(); err != nil {
|
|
||||||
logrus.
|
|
||||||
WithField("action", "es client v7 ping error").
|
|
||||||
WithField("err", err).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
if infoResp.StatusCode != 200 {
|
|
||||||
err = fmt.Errorf("info xes status=%d", infoResp.StatusCode)
|
|
||||||
logrus.
|
|
||||||
WithField("action", "es client v7 ping status error").
|
|
||||||
WithField("status", infoResp.StatusCode).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
cliCh <- cli
|
|
||||||
}
|
|
||||||
|
|
||||||
go ncFunc([]string{address}, urlUsername, urlPassword, urlIndex)
|
|
||||||
|
|
||||||
select {
|
|
||||||
case <-util.Timeout(10).Done():
|
|
||||||
return nil, fmt.Errorf("dial es=%s err=%v", address, context.DeadlineExceeded)
|
|
||||||
case c := <-cliCh:
|
|
||||||
return &client{c: c, index: urlIndex, iot: iot}, nil
|
|
||||||
case e := <-errCh:
|
|
||||||
return nil, e
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
type client struct {
|
|
||||||
c *elastic.Client
|
|
||||||
iot interfaces.IO
|
|
||||||
index string
|
|
||||||
scrollId string
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) checkResponse(r *esapi.Response) error {
|
|
||||||
if r.StatusCode == 200 {
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
|
|
||||||
return fmt.Errorf("status=%d msg=%s", r.StatusCode, r.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) IOType() interfaces.IO {
|
|
||||||
return c.iot
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) IsFile() bool {
|
|
||||||
return false
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) Close() error {
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) ResetOffset() {
|
|
||||||
defer func() {
|
|
||||||
c.scrollId = ""
|
|
||||||
}()
|
|
||||||
|
|
||||||
bs, _ := json.Marshal(map[string]string{
|
|
||||||
"scroll_id": c.scrollId,
|
|
||||||
})
|
|
||||||
|
|
||||||
rr, err := c.c.ClearScroll(
|
|
||||||
c.c.ClearScroll.WithContext(util.Timeout(3)),
|
|
||||||
c.c.ClearScroll.WithBody(bytes.NewReader(bs)),
|
|
||||||
)
|
|
||||||
if err != nil {
|
|
||||||
log.Warn("ResetOffset: clear scroll id=%s err=%v", c.scrollId, err)
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
if rr.StatusCode != 200 {
|
|
||||||
log.Warn("ResetOffset: clear scroll id=%s msg=%s", c.scrollId, rr.String())
|
|
||||||
}
|
|
||||||
}
|
|
||||||
func (c *client) WriteData(ctx context.Context, docs []*interfaces.ESSource) (int, error) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
indexer esutil.BulkIndexer
|
|
||||||
count int
|
|
||||||
be error
|
|
||||||
)
|
|
||||||
if indexer, err = esutil.NewBulkIndexer(esutil.BulkIndexerConfig{
|
|
||||||
Client: c.c,
|
|
||||||
Index: c.index,
|
|
||||||
ErrorTrace: true,
|
|
||||||
OnError: func(ctx context.Context, err error) {
|
|
||||||
|
|
||||||
},
|
|
||||||
}); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
for _, doc := range docs {
|
|
||||||
var bs []byte
|
|
||||||
|
|
||||||
if bs, err = json.Marshal(doc.Content); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if err = indexer.Add(context.Background(), esutil.BulkIndexerItem{
|
|
||||||
Action: "index",
|
|
||||||
Index: c.index,
|
|
||||||
DocumentID: doc.DocId,
|
|
||||||
Body: bytes.NewReader(bs),
|
|
||||||
OnFailure: func(ctx context.Context, item esutil.BulkIndexerItem, item2 esutil.BulkIndexerResponseItem, bulkErr error) {
|
|
||||||
be = bulkErr
|
|
||||||
},
|
|
||||||
}); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
count++
|
|
||||||
}
|
|
||||||
|
|
||||||
if err = indexer.Close(util.TimeoutCtx(ctx, opt.Timeout)); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if be != nil {
|
|
||||||
return 0, be
|
|
||||||
}
|
|
||||||
|
|
||||||
stats := indexer.Stats()
|
|
||||||
if stats.NumFailed > 0 {
|
|
||||||
return count, fmt.Errorf("write to xes failed_count=%d bulk_count=%d", stats.NumFailed, count)
|
|
||||||
}
|
|
||||||
|
|
||||||
return count, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) ReadData(ctx context.Context, i int, query map[string]any, source []string) ([]*interfaces.ESSource, error) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
resp *esapi.Response
|
|
||||||
result = new(interfaces.ESResponse)
|
|
||||||
)
|
|
||||||
|
|
||||||
if c.scrollId == "" {
|
|
||||||
qs := []func(*esapi.SearchRequest){
|
|
||||||
c.c.Search.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
|
||||||
c.c.Search.WithIndex(c.index),
|
|
||||||
c.c.Search.WithSize(i),
|
|
||||||
c.c.Search.WithFrom(0),
|
|
||||||
c.c.Search.WithScroll(time.Duration(opt.Timeout*2) * time.Second),
|
|
||||||
}
|
|
||||||
|
|
||||||
if len(source) > 0 {
|
|
||||||
qs = append(qs, c.c.Search.WithSourceIncludes(source...))
|
|
||||||
}
|
|
||||||
|
|
||||||
if query != nil && len(query) > 0 {
|
|
||||||
queryBs, _ := json.Marshal(map[string]any{"query": query})
|
|
||||||
qs = append(qs, c.c.Search.WithBody(bytes.NewReader(queryBs)))
|
|
||||||
}
|
|
||||||
|
|
||||||
if resp, err = c.c.Search(qs...); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if resp.StatusCode != 200 {
|
|
||||||
return nil, fmt.Errorf(resp.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
decoder := json.NewDecoder(resp.Body)
|
|
||||||
if err = decoder.Decode(result); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
c.scrollId = result.ScrollId
|
|
||||||
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
if resp, err = c.c.Scroll(
|
|
||||||
c.c.Scroll.WithScrollID(c.scrollId),
|
|
||||||
c.c.Scroll.WithScroll(time.Duration(opt.Timeout*2)*time.Second),
|
|
||||||
); err != nil {
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
decoder := json.NewDecoder(resp.Body)
|
|
||||||
if err = decoder.Decode(result); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) ReadMapping(ctx context.Context) (map[string]any, error) {
|
|
||||||
r, err := c.c.Indices.GetMapping(
|
|
||||||
c.c.Indices.GetMapping.WithIndex(c.index),
|
|
||||||
)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if r.StatusCode != 200 {
|
|
||||||
return nil, fmt.Errorf("status=%d, msg=%s", r.StatusCode, r.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
m := make(map[string]any)
|
|
||||||
decoder := json.NewDecoder(r.Body)
|
|
||||||
if err = decoder.Decode(&m); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
return m, nil
|
|
||||||
}
|
|
||||||
func (c *client) WriteMapping(ctx context.Context, m map[string]any) error {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
bs []byte
|
|
||||||
result *esapi.Response
|
|
||||||
)
|
|
||||||
|
|
||||||
for idxKey := range m {
|
|
||||||
if bs, err = json.Marshal(m[idxKey]); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
if result, err = c.c.Indices.Create(
|
|
||||||
c.index,
|
|
||||||
c.c.Indices.Create.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
|
||||||
c.c.Indices.Create.WithBody(bytes.NewReader(bs)),
|
|
||||||
); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
if err = c.checkResponse(result); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) ReadSetting(ctx context.Context) (map[string]any, error) {
|
|
||||||
r, err := c.c.Indices.GetSettings(
|
|
||||||
c.c.Indices.GetSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
|
||||||
c.c.Indices.GetSettings.WithIndex(c.index),
|
|
||||||
)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if r.StatusCode != 200 {
|
|
||||||
return nil, fmt.Errorf("status=%d, msg=%s", r.StatusCode, r.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
m := make(map[string]any)
|
|
||||||
decoder := json.NewDecoder(r.Body)
|
|
||||||
if err = decoder.Decode(&m); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
return m, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) WriteSetting(ctx context.Context, m map[string]any) error {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
bs []byte
|
|
||||||
result *esapi.Response
|
|
||||||
)
|
|
||||||
|
|
||||||
if bs, err = json.Marshal(m); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
if result, err = c.c.Indices.PutSettings(
|
|
||||||
bytes.NewReader(bs),
|
|
||||||
c.c.Indices.PutSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
|
||||||
); err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
return c.checkResponse(result)
|
|
||||||
}
|
|
@ -6,8 +6,9 @@ import (
|
|||||||
"crypto/tls"
|
"crypto/tls"
|
||||||
"encoding/json"
|
"encoding/json"
|
||||||
"fmt"
|
"fmt"
|
||||||
"github.com/loveuer/esgo2dump/internal/log"
|
"github.com/loveuer/esgo2dump/log"
|
||||||
"io"
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
"github.com/loveuer/esgo2dump/xes/es6"
|
||||||
"net"
|
"net"
|
||||||
"net/http"
|
"net/http"
|
||||||
"net/url"
|
"net/url"
|
||||||
@ -16,11 +17,9 @@ import (
|
|||||||
|
|
||||||
elastic "github.com/elastic/go-elasticsearch/v6"
|
elastic "github.com/elastic/go-elasticsearch/v6"
|
||||||
"github.com/elastic/go-elasticsearch/v6/esapi"
|
"github.com/elastic/go-elasticsearch/v6/esapi"
|
||||||
"github.com/elastic/go-elasticsearch/v6/esutil"
|
|
||||||
"github.com/loveuer/esgo2dump/internal/interfaces"
|
"github.com/loveuer/esgo2dump/internal/interfaces"
|
||||||
"github.com/loveuer/esgo2dump/internal/opt"
|
"github.com/loveuer/esgo2dump/internal/opt"
|
||||||
"github.com/loveuer/esgo2dump/internal/util"
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
"github.com/sirupsen/logrus"
|
|
||||||
)
|
)
|
||||||
|
|
||||||
func NewClientV6(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
func NewClientV6(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
||||||
@ -41,13 +40,7 @@ func NewClientV6(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
|||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
logrus.
|
log.Debug("action=%s, endpoint=%s, index=%s, username=%s, password=%s", "new es client v6", address, urlIndex, urlUsername, urlPassword)
|
||||||
WithField("action", "new es client v6").
|
|
||||||
WithField("endpoint", address).
|
|
||||||
WithField("index", urlIndex).
|
|
||||||
WithField("username", urlUsername).
|
|
||||||
WithField("password", urlPassword).
|
|
||||||
Debug()
|
|
||||||
|
|
||||||
if urlIndex == "" {
|
if urlIndex == "" {
|
||||||
return nil, fmt.Errorf("please specify index name: (like => http://127.0.0.1:9200/my_index)")
|
return nil, fmt.Errorf("please specify index name: (like => http://127.0.0.1:9200/my_index)")
|
||||||
@ -75,30 +68,20 @@ func NewClientV6(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
|||||||
},
|
},
|
||||||
},
|
},
|
||||||
); err != nil {
|
); err != nil {
|
||||||
logrus.
|
log.Debug("action=%s, endpoints=%v, err=%s", "new es client v6 error", endpoints, err.Error())
|
||||||
WithField("action", "new es client v6 error").
|
|
||||||
WithField("endpoints", endpoints).
|
|
||||||
WithField("err", err).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
errCh <- err
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
|
|
||||||
if infoResp, err = cli.Info(); err != nil {
|
if infoResp, err = cli.Info(); err != nil {
|
||||||
logrus.
|
log.Debug("action=%s, endpoints=%v, err=%s", "new es client v6 info error", endpoints, err.Error())
|
||||||
WithField("action", "es client v6 ping error").
|
|
||||||
WithField("err", err).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
errCh <- err
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
|
|
||||||
if infoResp.StatusCode != 200 {
|
if infoResp.StatusCode != 200 {
|
||||||
err = fmt.Errorf("info xes status=%d", infoResp.StatusCode)
|
err = fmt.Errorf("info xes status=%d", infoResp.StatusCode)
|
||||||
logrus.
|
log.Debug("action=%s, endpoints=%v, err=%s", "es client v6 ping status error", endpoints, err.Error())
|
||||||
WithField("action", "es client v6 ping status error").
|
|
||||||
WithField("status", infoResp.StatusCode).
|
|
||||||
Debug()
|
|
||||||
errCh <- err
|
errCh <- err
|
||||||
return
|
return
|
||||||
}
|
}
|
||||||
@ -112,17 +95,24 @@ func NewClientV6(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
|||||||
case <-util.Timeout(10).Done():
|
case <-util.Timeout(10).Done():
|
||||||
return nil, fmt.Errorf("dial es=%s err=%v", address, context.DeadlineExceeded)
|
return nil, fmt.Errorf("dial es=%s err=%v", address, context.DeadlineExceeded)
|
||||||
case c := <-cliCh:
|
case c := <-cliCh:
|
||||||
return &clientv6{c: c, index: urlIndex, iot: iot}, nil
|
return &clientv6{client: c, index: urlIndex, iot: iot}, nil
|
||||||
case e := <-errCh:
|
case e := <-errCh:
|
||||||
return nil, e
|
return nil, e
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
type clientv6 struct {
|
type clientv6 struct {
|
||||||
c *elastic.Client
|
client *elastic.Client
|
||||||
iot interfaces.IO
|
iot interfaces.IO
|
||||||
index string
|
index string
|
||||||
scrollId string
|
}
|
||||||
|
|
||||||
|
func (c *clientv6) Info(msg string, data ...any) {
|
||||||
|
log.Info(msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *clientv6) WriteData(ctx context.Context, docsCh <-chan []*model.ESSource) error {
|
||||||
|
return es6.WriteData(ctx, c.client, c.index, docsCh, c)
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *clientv6) checkResponse(r *esapi.Response) error {
|
func (c *clientv6) checkResponse(r *esapi.Response) error {
|
||||||
@ -145,153 +135,15 @@ func (c *clientv6) Close() error {
|
|||||||
return nil
|
return nil
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *clientv6) ResetOffset() {
|
func (c *clientv6) ReadData(ctx context.Context, size int, query map[string]any, source []string) (<-chan []*model.ESSource, <-chan error) {
|
||||||
defer func() {
|
dch, ech := es6.ReadData(ctx, c.client, c.index, size, 0, query, source)
|
||||||
c.scrollId = ""
|
|
||||||
}()
|
|
||||||
|
|
||||||
bs, _ := json.Marshal(map[string]string{
|
return dch, ech
|
||||||
"scroll_id": c.scrollId,
|
|
||||||
})
|
|
||||||
|
|
||||||
rr, err := c.c.ClearScroll(
|
|
||||||
c.c.ClearScroll.WithContext(util.Timeout(3)),
|
|
||||||
c.c.ClearScroll.WithBody(bytes.NewReader(bs)),
|
|
||||||
)
|
|
||||||
if err != nil {
|
|
||||||
log.Warn("ResetOffset: clear scroll id=%s err=%v", c.scrollId, err)
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
if rr.StatusCode != 200 {
|
|
||||||
log.Warn("ResetOffset: clear scroll id=%s msg=%s", c.scrollId, rr.String())
|
|
||||||
}
|
|
||||||
}
|
|
||||||
func (c *clientv6) WriteData(ctx context.Context, docs []*interfaces.ESSource) (int, error) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
indexer esutil.BulkIndexer
|
|
||||||
count int
|
|
||||||
be error
|
|
||||||
)
|
|
||||||
if indexer, err = esutil.NewBulkIndexer(esutil.BulkIndexerConfig{
|
|
||||||
Client: c.c,
|
|
||||||
Index: c.index,
|
|
||||||
DocumentType: "_doc",
|
|
||||||
ErrorTrace: true,
|
|
||||||
}); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
for _, doc := range docs {
|
|
||||||
var bs []byte
|
|
||||||
|
|
||||||
if bs, err = json.Marshal(doc.Content); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
logrus.WithField("raw", string(bs)).Debug()
|
|
||||||
|
|
||||||
if err = indexer.Add(context.Background(), esutil.BulkIndexerItem{
|
|
||||||
Action: "index",
|
|
||||||
Index: c.index,
|
|
||||||
DocumentID: doc.DocId,
|
|
||||||
Body: bytes.NewReader(bs),
|
|
||||||
OnFailure: func(ctx context.Context, item esutil.BulkIndexerItem, item2 esutil.BulkIndexerResponseItem, bulkErr error) {
|
|
||||||
be = bulkErr
|
|
||||||
},
|
|
||||||
}); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
count++
|
|
||||||
}
|
|
||||||
|
|
||||||
if err = indexer.Close(util.TimeoutCtx(ctx, opt.Timeout)); err != nil {
|
|
||||||
return 0, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if be != nil {
|
|
||||||
return 0, be
|
|
||||||
}
|
|
||||||
|
|
||||||
stats := indexer.Stats()
|
|
||||||
if stats.NumFailed > 0 {
|
|
||||||
return count, fmt.Errorf("write to xes failed_count=%d bulk_count=%d", stats.NumFailed, count)
|
|
||||||
}
|
|
||||||
|
|
||||||
return count, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *clientv6) ReadData(ctx context.Context, i int, query map[string]any, source []string) ([]*interfaces.ESSource, error) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
resp *esapi.Response
|
|
||||||
result = new(interfaces.ESResponseV6)
|
|
||||||
bs []byte
|
|
||||||
)
|
|
||||||
|
|
||||||
if c.scrollId == "" {
|
|
||||||
qs := []func(*esapi.SearchRequest){
|
|
||||||
c.c.Search.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
|
||||||
c.c.Search.WithIndex(c.index),
|
|
||||||
c.c.Search.WithSize(i),
|
|
||||||
c.c.Search.WithFrom(0),
|
|
||||||
c.c.Search.WithScroll(time.Duration(opt.Timeout*2) * time.Second),
|
|
||||||
}
|
|
||||||
|
|
||||||
if len(source) > 0 {
|
|
||||||
qs = append(qs, c.c.Search.WithSourceIncludes(source...))
|
|
||||||
}
|
|
||||||
|
|
||||||
if query != nil && len(query) > 0 {
|
|
||||||
queryBs, _ := json.Marshal(map[string]any{"query": query})
|
|
||||||
qs = append(qs, c.c.Search.WithBody(bytes.NewReader(queryBs)))
|
|
||||||
}
|
|
||||||
|
|
||||||
if resp, err = c.c.Search(qs...); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
defer resp.Body.Close()
|
|
||||||
|
|
||||||
if resp.StatusCode != 200 {
|
|
||||||
return nil, fmt.Errorf(resp.String())
|
|
||||||
}
|
|
||||||
|
|
||||||
if bs, err = io.ReadAll(resp.Body); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if err = json.Unmarshal(bs, result); err != nil {
|
|
||||||
logrus.
|
|
||||||
WithField("err", err.Error()).
|
|
||||||
WithField("raw", string(bs)).
|
|
||||||
Debug()
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
c.scrollId = result.ScrollId
|
|
||||||
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
if resp, err = c.c.Scroll(
|
|
||||||
c.c.Scroll.WithScrollID(c.scrollId),
|
|
||||||
c.c.Scroll.WithScroll(time.Duration(opt.Timeout*2)*time.Second),
|
|
||||||
); err != nil {
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
decoder := json.NewDecoder(resp.Body)
|
|
||||||
if err = decoder.Decode(result); err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
return result.Hits.Hits, nil
|
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *clientv6) ReadMapping(ctx context.Context) (map[string]any, error) {
|
func (c *clientv6) ReadMapping(ctx context.Context) (map[string]any, error) {
|
||||||
r, err := c.c.Indices.GetMapping(
|
r, err := c.client.Indices.GetMapping(
|
||||||
c.c.Indices.GetMapping.WithIndex(c.index),
|
c.client.Indices.GetMapping.WithIndex(c.index),
|
||||||
)
|
)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return nil, err
|
return nil, err
|
||||||
@ -321,10 +173,10 @@ func (c *clientv6) WriteMapping(ctx context.Context, m map[string]any) error {
|
|||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
if result, err = c.c.Indices.Create(
|
if result, err = c.client.Indices.Create(
|
||||||
c.index,
|
c.index,
|
||||||
c.c.Indices.Create.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
c.client.Indices.Create.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
c.c.Indices.Create.WithBody(bytes.NewReader(bs)),
|
c.client.Indices.Create.WithBody(bytes.NewReader(bs)),
|
||||||
); err != nil {
|
); err != nil {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
@ -338,9 +190,9 @@ func (c *clientv6) WriteMapping(ctx context.Context, m map[string]any) error {
|
|||||||
}
|
}
|
||||||
|
|
||||||
func (c *clientv6) ReadSetting(ctx context.Context) (map[string]any, error) {
|
func (c *clientv6) ReadSetting(ctx context.Context) (map[string]any, error) {
|
||||||
r, err := c.c.Indices.GetSettings(
|
r, err := c.client.Indices.GetSettings(
|
||||||
c.c.Indices.GetSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
c.client.Indices.GetSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
c.c.Indices.GetSettings.WithIndex(c.index),
|
c.client.Indices.GetSettings.WithIndex(c.index),
|
||||||
)
|
)
|
||||||
if err != nil {
|
if err != nil {
|
||||||
return nil, err
|
return nil, err
|
||||||
@ -370,9 +222,9 @@ func (c *clientv6) WriteSetting(ctx context.Context, m map[string]any) error {
|
|||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
|
||||||
if result, err = c.c.Indices.PutSettings(
|
if result, err = c.client.Indices.PutSettings(
|
||||||
bytes.NewReader(bs),
|
bytes.NewReader(bs),
|
||||||
c.c.Indices.PutSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
c.client.Indices.PutSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
); err != nil {
|
); err != nil {
|
||||||
return err
|
return err
|
||||||
}
|
}
|
||||||
|
223
internal/xes/xes7.go
Normal file
223
internal/xes/xes7.go
Normal file
@ -0,0 +1,223 @@
|
|||||||
|
package xes
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"context"
|
||||||
|
"encoding/json"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v7"
|
||||||
|
"github.com/elastic/go-elasticsearch/v7/esapi"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/interfaces"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/opt"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
"github.com/loveuer/esgo2dump/xes/es7"
|
||||||
|
"net/url"
|
||||||
|
"strings"
|
||||||
|
)
|
||||||
|
|
||||||
|
type client struct {
|
||||||
|
client *elastic.Client
|
||||||
|
iot interfaces.IO
|
||||||
|
index string
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) Info(msg string, data ...any) {
|
||||||
|
log.Info(msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) WriteData(ctx context.Context, docsCh <-chan []*model.ESSource) error {
|
||||||
|
return es7.WriteData(ctx, c.client, c.index, docsCh, c)
|
||||||
|
}
|
||||||
|
|
||||||
|
func NewClient(url *url.URL, iot interfaces.IO) (interfaces.DumpIO, error) {
|
||||||
|
|
||||||
|
var (
|
||||||
|
urlIndex = strings.TrimPrefix(url.Path, "/")
|
||||||
|
cli *elastic.Client
|
||||||
|
err error
|
||||||
|
)
|
||||||
|
|
||||||
|
if urlIndex == "" {
|
||||||
|
return nil, fmt.Errorf("please specify index name: (like => http://127.0.0.1:9200/my_index)")
|
||||||
|
}
|
||||||
|
|
||||||
|
if cli, err = es7.NewClient(context.TODO(), url); err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return &client{client: cli, iot: iot, index: urlIndex}, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) checkResponse(r *esapi.Response) error {
|
||||||
|
if r.StatusCode == 200 {
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
return fmt.Errorf("status=%d msg=%s", r.StatusCode, r.String())
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) IOType() interfaces.IO {
|
||||||
|
return c.iot
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) IsFile() bool {
|
||||||
|
return false
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) Close() error {
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
//func (c *client) WriteData(ctx context.Context, docs []*model.ESSource) (int, error) {
|
||||||
|
// var (
|
||||||
|
// err error
|
||||||
|
// indexer esutil.BulkIndexer
|
||||||
|
// count int
|
||||||
|
// be error
|
||||||
|
// )
|
||||||
|
// if indexer, err = esutil.NewBulkIndexer(esutil.BulkIndexerConfig{
|
||||||
|
// Client: c.client,
|
||||||
|
// Index: c.index,
|
||||||
|
// ErrorTrace: true,
|
||||||
|
// OnError: func(ctx context.Context, err error) {
|
||||||
|
//
|
||||||
|
// },
|
||||||
|
// }); err != nil {
|
||||||
|
// return 0, err
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// for _, doc := range docs {
|
||||||
|
// var bs []byte
|
||||||
|
//
|
||||||
|
// if bs, err = json.Marshal(doc.Content); err != nil {
|
||||||
|
// return 0, err
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// if err = indexer.Add(context.Background(), esutil.BulkIndexerItem{
|
||||||
|
// Action: "index",
|
||||||
|
// Index: c.index,
|
||||||
|
// DocumentID: doc.DocId,
|
||||||
|
// Body: bytes.NewReader(bs),
|
||||||
|
// OnFailure: func(ctx context.Context, item esutil.BulkIndexerItem, item2 esutil.BulkIndexerResponseItem, bulkErr error) {
|
||||||
|
// be = bulkErr
|
||||||
|
// },
|
||||||
|
// }); err != nil {
|
||||||
|
// return 0, err
|
||||||
|
// }
|
||||||
|
// count++
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// if err = indexer.Close(util.TimeoutCtx(ctx, opt.Timeout)); err != nil {
|
||||||
|
// return 0, err
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// if be != nil {
|
||||||
|
// return 0, be
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// stats := indexer.Stats()
|
||||||
|
// if stats.NumFailed > 0 {
|
||||||
|
// return count, fmt.Errorf("write to xes failed_count=%d bulk_count=%d", stats.NumFailed, count)
|
||||||
|
// }
|
||||||
|
//
|
||||||
|
// return count, nil
|
||||||
|
//}
|
||||||
|
|
||||||
|
func (c *client) ReadData(ctx context.Context, size int, query map[string]any, source []string) (<-chan []*model.ESSource, <-chan error) {
|
||||||
|
dch, ech := es7.ReadData(ctx, c.client, c.index, size, 0, query, source)
|
||||||
|
|
||||||
|
return dch, ech
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) ReadMapping(ctx context.Context) (map[string]any, error) {
|
||||||
|
r, err := c.client.Indices.GetMapping(
|
||||||
|
c.client.Indices.GetMapping.WithIndex(c.index),
|
||||||
|
)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if r.StatusCode != 200 {
|
||||||
|
return nil, fmt.Errorf("status=%d, msg=%s", r.StatusCode, r.String())
|
||||||
|
}
|
||||||
|
|
||||||
|
m := make(map[string]any)
|
||||||
|
decoder := json.NewDecoder(r.Body)
|
||||||
|
if err = decoder.Decode(&m); err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return m, nil
|
||||||
|
}
|
||||||
|
func (c *client) WriteMapping(ctx context.Context, m map[string]any) error {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
bs []byte
|
||||||
|
result *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
for idxKey := range m {
|
||||||
|
if bs, err = json.Marshal(m[idxKey]); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if result, err = c.client.Indices.Create(
|
||||||
|
c.index,
|
||||||
|
c.client.Indices.Create.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
|
c.client.Indices.Create.WithBody(bytes.NewReader(bs)),
|
||||||
|
); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if err = c.checkResponse(result); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) ReadSetting(ctx context.Context) (map[string]any, error) {
|
||||||
|
r, err := c.client.Indices.GetSettings(
|
||||||
|
c.client.Indices.GetSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
|
c.client.Indices.GetSettings.WithIndex(c.index),
|
||||||
|
)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if r.StatusCode != 200 {
|
||||||
|
return nil, fmt.Errorf("status=%d, msg=%s", r.StatusCode, r.String())
|
||||||
|
}
|
||||||
|
|
||||||
|
m := make(map[string]any)
|
||||||
|
decoder := json.NewDecoder(r.Body)
|
||||||
|
if err = decoder.Decode(&m); err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return m, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (c *client) WriteSetting(ctx context.Context, m map[string]any) error {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
bs []byte
|
||||||
|
result *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
if bs, err = json.Marshal(m); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if result, err = c.client.Indices.PutSettings(
|
||||||
|
bytes.NewReader(bs),
|
||||||
|
c.client.Indices.PutSettings.WithContext(util.TimeoutCtx(ctx, opt.Timeout)),
|
||||||
|
); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
return c.checkResponse(result)
|
||||||
|
}
|
@ -4,11 +4,12 @@ import (
|
|||||||
"bufio"
|
"bufio"
|
||||||
"context"
|
"context"
|
||||||
"encoding/json"
|
"encoding/json"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/opt"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
"io"
|
"io"
|
||||||
"os"
|
"os"
|
||||||
|
|
||||||
"github.com/loveuer/esgo2dump/internal/opt"
|
|
||||||
|
|
||||||
"github.com/loveuer/esgo2dump/internal/interfaces"
|
"github.com/loveuer/esgo2dump/internal/interfaces"
|
||||||
)
|
)
|
||||||
|
|
||||||
@ -18,6 +19,29 @@ type client struct {
|
|||||||
scanner *bufio.Scanner
|
scanner *bufio.Scanner
|
||||||
}
|
}
|
||||||
|
|
||||||
|
func (c *client) WriteData(ctx context.Context, docsCh <-chan []*model.ESSource) error {
|
||||||
|
total := 0
|
||||||
|
for line := range docsCh {
|
||||||
|
for _, doc := range line {
|
||||||
|
bs, err := json.Marshal(doc)
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if _, err = c.f.Write(append(bs, '\n')); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
count := len(line)
|
||||||
|
total += count
|
||||||
|
|
||||||
|
log.Info("Dump: succeed=%d total=%d docs succeed!!!", count, total)
|
||||||
|
}
|
||||||
|
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
func (c *client) ReadMapping(ctx context.Context) (map[string]any, error) {
|
func (c *client) ReadMapping(ctx context.Context) (map[string]any, error) {
|
||||||
var (
|
var (
|
||||||
err error
|
err error
|
||||||
@ -86,60 +110,62 @@ func (c *client) IsFile() bool {
|
|||||||
return true
|
return true
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *client) ResetOffset() {}
|
func (c *client) ReadData(ctx context.Context, size int, _ map[string]any, _ []string) (<-chan []*model.ESSource, <-chan error) {
|
||||||
|
|
||||||
func (c *client) WriteData(ctx context.Context, docs []*interfaces.ESSource) (int, error) {
|
|
||||||
var (
|
|
||||||
err error
|
|
||||||
bs []byte
|
|
||||||
count = 0
|
|
||||||
)
|
|
||||||
|
|
||||||
for _, doc := range docs {
|
|
||||||
if bs, err = json.Marshal(doc); err != nil {
|
|
||||||
return count, err
|
|
||||||
}
|
|
||||||
|
|
||||||
bs = append(bs, '\n')
|
|
||||||
|
|
||||||
if _, err = c.f.Write(bs); err != nil {
|
|
||||||
return count, err
|
|
||||||
}
|
|
||||||
|
|
||||||
count++
|
|
||||||
}
|
|
||||||
|
|
||||||
return count, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (c *client) ReadData(ctx context.Context, i int, _ map[string]any, _ []string) ([]*interfaces.ESSource, error) {
|
|
||||||
var (
|
var (
|
||||||
err error
|
err error
|
||||||
count = 0
|
count = 0
|
||||||
list = make([]*interfaces.ESSource, 0, i)
|
list = make([]*model.ESSource, 0, size)
|
||||||
|
dch = make(chan []*model.ESSource)
|
||||||
|
ech = make(chan error)
|
||||||
|
ready = make(chan bool)
|
||||||
)
|
)
|
||||||
|
|
||||||
|
go func(ctx context.Context) {
|
||||||
|
defer func() {
|
||||||
|
close(dch)
|
||||||
|
close(ech)
|
||||||
|
}()
|
||||||
|
|
||||||
|
ready <- true
|
||||||
|
|
||||||
for c.scanner.Scan() {
|
for c.scanner.Scan() {
|
||||||
line := c.scanner.Text()
|
select {
|
||||||
|
case <-ctx.Done():
|
||||||
|
return
|
||||||
|
default:
|
||||||
|
item := new(model.ESSource)
|
||||||
|
line := c.scanner.Bytes()
|
||||||
|
|
||||||
item := new(interfaces.ESSource)
|
if err = json.Unmarshal(line, item); err != nil {
|
||||||
if err = json.Unmarshal([]byte(line), item); err != nil {
|
ech <- err
|
||||||
return list, err
|
return
|
||||||
}
|
}
|
||||||
|
|
||||||
list = append(list, item)
|
list = append(list, item)
|
||||||
|
|
||||||
count++
|
count++
|
||||||
if count >= i {
|
|
||||||
break
|
if count >= size {
|
||||||
|
dch <- list
|
||||||
|
list = list[:0]
|
||||||
|
count = 0
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(list) > 0 {
|
||||||
|
dch <- list
|
||||||
|
list = list[:0]
|
||||||
|
count = 0
|
||||||
|
}
|
||||||
|
|
||||||
if err = c.scanner.Err(); err != nil {
|
if err = c.scanner.Err(); err != nil {
|
||||||
return list, err
|
ech <- err
|
||||||
}
|
}
|
||||||
|
}(ctx)
|
||||||
|
|
||||||
return list, nil
|
<-ready
|
||||||
|
|
||||||
|
return dch, ech
|
||||||
}
|
}
|
||||||
|
|
||||||
func (c *client) Close() error {
|
func (c *client) Close() error {
|
||||||
|
48
log/default.go
Normal file
48
log/default.go
Normal file
@ -0,0 +1,48 @@
|
|||||||
|
package log
|
||||||
|
|
||||||
|
import (
|
||||||
|
"fmt"
|
||||||
|
"os"
|
||||||
|
"sync"
|
||||||
|
)
|
||||||
|
|
||||||
|
var (
|
||||||
|
nilLogger = func(prefix, timestamp, msg string, data ...any) {}
|
||||||
|
normalLogger = func(prefix, timestamp, msg string, data ...any) {
|
||||||
|
fmt.Printf(prefix+"| "+timestamp+" | "+msg+"\n", data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
defaultLogger = &logger{
|
||||||
|
Mutex: sync.Mutex{},
|
||||||
|
timeFormat: "2006-01-02T15:04:05",
|
||||||
|
writer: os.Stdout,
|
||||||
|
level: LogLevelInfo,
|
||||||
|
debug: nilLogger,
|
||||||
|
info: normalLogger,
|
||||||
|
warn: normalLogger,
|
||||||
|
error: normalLogger,
|
||||||
|
}
|
||||||
|
)
|
||||||
|
|
||||||
|
func SetTimeFormat(format string) {
|
||||||
|
defaultLogger.SetTimeFormat(format)
|
||||||
|
}
|
||||||
|
|
||||||
|
func SetLogLevel(level LogLevel) {
|
||||||
|
defaultLogger.SetLogLevel(level)
|
||||||
|
}
|
||||||
|
|
||||||
|
func Debug(msg string, data ...any) {
|
||||||
|
defaultLogger.Debug(msg, data...)
|
||||||
|
}
|
||||||
|
func Info(msg string, data ...any) {
|
||||||
|
defaultLogger.Info(msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func Warn(msg string, data ...any) {
|
||||||
|
defaultLogger.Warn(msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func Error(msg string, data ...any) {
|
||||||
|
defaultLogger.Error(msg, data...)
|
||||||
|
}
|
90
log/log.go
Normal file
90
log/log.go
Normal file
@ -0,0 +1,90 @@
|
|||||||
|
package log
|
||||||
|
|
||||||
|
import (
|
||||||
|
"github.com/fatih/color"
|
||||||
|
"io"
|
||||||
|
"sync"
|
||||||
|
"time"
|
||||||
|
)
|
||||||
|
|
||||||
|
type LogLevel uint32
|
||||||
|
|
||||||
|
const (
|
||||||
|
LogLevelDebug = iota
|
||||||
|
LogLevelInfo
|
||||||
|
LogLevelWarn
|
||||||
|
LogLevelError
|
||||||
|
)
|
||||||
|
|
||||||
|
type logger struct {
|
||||||
|
sync.Mutex
|
||||||
|
timeFormat string
|
||||||
|
writer io.Writer
|
||||||
|
level LogLevel
|
||||||
|
debug func(prefix, timestamp, msg string, data ...any)
|
||||||
|
info func(prefix, timestamp, msg string, data ...any)
|
||||||
|
warn func(prefix, timestamp, msg string, data ...any)
|
||||||
|
error func(prefix, timestamp, msg string, data ...any)
|
||||||
|
}
|
||||||
|
|
||||||
|
var (
|
||||||
|
red = color.New(color.FgRed)
|
||||||
|
green = color.New(color.FgGreen)
|
||||||
|
yellow = color.New(color.FgYellow)
|
||||||
|
white = color.New(color.FgWhite)
|
||||||
|
)
|
||||||
|
|
||||||
|
func (l *logger) SetTimeFormat(format string) {
|
||||||
|
l.Lock()
|
||||||
|
defer l.Unlock()
|
||||||
|
l.timeFormat = format
|
||||||
|
}
|
||||||
|
|
||||||
|
func (l *logger) SetLogLevel(level LogLevel) {
|
||||||
|
l.Lock()
|
||||||
|
defer l.Unlock()
|
||||||
|
|
||||||
|
if level > LogLevelDebug {
|
||||||
|
l.debug = nilLogger
|
||||||
|
} else {
|
||||||
|
l.debug = normalLogger
|
||||||
|
}
|
||||||
|
|
||||||
|
if level > LogLevelInfo {
|
||||||
|
l.info = nilLogger
|
||||||
|
} else {
|
||||||
|
l.info = normalLogger
|
||||||
|
}
|
||||||
|
|
||||||
|
if level > LogLevelWarn {
|
||||||
|
l.warn = nilLogger
|
||||||
|
} else {
|
||||||
|
l.warn = normalLogger
|
||||||
|
}
|
||||||
|
|
||||||
|
if level > LogLevelError {
|
||||||
|
l.error = nilLogger
|
||||||
|
} else {
|
||||||
|
l.error = normalLogger
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
func (l *logger) Debug(msg string, data ...any) {
|
||||||
|
l.debug(white.Sprint("Debug "), time.Now().Format(l.timeFormat), msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (l *logger) Info(msg string, data ...any) {
|
||||||
|
l.info(green.Sprint("Info "), time.Now().Format(l.timeFormat), msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (l *logger) Warn(msg string, data ...any) {
|
||||||
|
l.warn(yellow.Sprint("Warn "), time.Now().Format(l.timeFormat), msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (l *logger) Error(msg string, data ...any) {
|
||||||
|
l.error(red.Sprint("Error "), time.Now().Format(l.timeFormat), msg, data...)
|
||||||
|
}
|
||||||
|
|
||||||
|
type WroteLogger interface {
|
||||||
|
Info(msg string, data ...any)
|
||||||
|
}
|
2
main.go
2
main.go
@ -2,7 +2,7 @@ package main
|
|||||||
|
|
||||||
import (
|
import (
|
||||||
"context"
|
"context"
|
||||||
"github.com/loveuer/esgo2dump/internal/log"
|
"github.com/loveuer/esgo2dump/log"
|
||||||
"os/signal"
|
"os/signal"
|
||||||
"syscall"
|
"syscall"
|
||||||
|
|
||||||
|
@ -1,4 +1,4 @@
|
|||||||
package interfaces
|
package model
|
||||||
|
|
||||||
type ESSource struct {
|
type ESSource struct {
|
||||||
DocId string `json:"_id"`
|
DocId string `json:"_id"`
|
||||||
@ -25,26 +25,3 @@ type ESResponse struct {
|
|||||||
Hits []*ESSource `json:"hits"`
|
Hits []*ESSource `json:"hits"`
|
||||||
} `json:"hits"`
|
} `json:"hits"`
|
||||||
}
|
}
|
||||||
|
|
||||||
type ESMapping map[string]struct {
|
|
||||||
Mappings struct {
|
|
||||||
Properties map[string]any `json:"properties"`
|
|
||||||
} `json:"mappings"`
|
|
||||||
}
|
|
||||||
|
|
||||||
type ESResponseV6 struct {
|
|
||||||
ScrollId string `json:"_scroll_id"`
|
|
||||||
Took int `json:"took"`
|
|
||||||
TimedOut bool `json:"timed_out"`
|
|
||||||
Shards struct {
|
|
||||||
Total int `json:"total"`
|
|
||||||
Successful int `json:"successful"`
|
|
||||||
Skipped int `json:"skipped"`
|
|
||||||
Failed int `json:"failed"`
|
|
||||||
} `json:"_shards"`
|
|
||||||
Hits struct {
|
|
||||||
Total int `json:"total"`
|
|
||||||
MaxScore float64 `json:"max_score"`
|
|
||||||
Hits []*ESSource `json:"hits"`
|
|
||||||
} `json:"hits"`
|
|
||||||
}
|
|
@ -3,7 +3,7 @@
|
|||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
- 当前仅支持 elasticsearch 7
|
- 支持 elasticsearch 7, elasticsearch 6
|
||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
@ -53,6 +53,7 @@ esgo2dump --input=http://127.0.0.1:9200/some_index --output=./data.json --query_
|
|||||||
- [x] es to file
|
- [x] es to file
|
||||||
- [x] es to es
|
- [x] es to es
|
||||||
- [x] auto create index with mapping
|
- [x] auto create index with mapping
|
||||||
|
- [ ] args: split_size (auto split json output file)
|
||||||
- [ ] auto create index with mapping,setting
|
- [ ] auto create index with mapping,setting
|
||||||
- [x] support es6
|
- [x] support es6
|
||||||
- [ ] support es8
|
- [ ] support es8
|
||||||
|
85
xes/es6/client.go
Normal file
85
xes/es6/client.go
Normal file
@ -0,0 +1,85 @@
|
|||||||
|
package es6
|
||||||
|
|
||||||
|
import (
|
||||||
|
"context"
|
||||||
|
"crypto/tls"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v6"
|
||||||
|
"github.com/elastic/go-elasticsearch/v6/esapi"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
|
"net"
|
||||||
|
"net/http"
|
||||||
|
"net/url"
|
||||||
|
"time"
|
||||||
|
)
|
||||||
|
|
||||||
|
func NewClient(ctx context.Context, url *url.URL) (*elastic.Client, error) {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
urlUsername string
|
||||||
|
urlPassword string
|
||||||
|
client *elastic.Client
|
||||||
|
errCh = make(chan error)
|
||||||
|
cliCh = make(chan *elastic.Client)
|
||||||
|
address = fmt.Sprintf("%s://%s", url.Scheme, url.Host)
|
||||||
|
)
|
||||||
|
|
||||||
|
if url.User != nil {
|
||||||
|
urlUsername = url.User.Username()
|
||||||
|
if p, ok := url.User.Password(); ok {
|
||||||
|
urlPassword = p
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
ncFunc := func(endpoints []string, username, password string) {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
cli *elastic.Client
|
||||||
|
infoResp *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
if cli, err = elastic.NewClient(
|
||||||
|
elastic.Config{
|
||||||
|
Addresses: endpoints,
|
||||||
|
Username: username,
|
||||||
|
Password: password,
|
||||||
|
CACert: nil,
|
||||||
|
RetryOnStatus: []int{429},
|
||||||
|
MaxRetries: 3,
|
||||||
|
RetryBackoff: nil,
|
||||||
|
Transport: &http.Transport{
|
||||||
|
TLSClientConfig: &tls.Config{InsecureSkipVerify: true},
|
||||||
|
DialContext: (&net.Dialer{Timeout: 10 * time.Second}).DialContext,
|
||||||
|
},
|
||||||
|
},
|
||||||
|
); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if infoResp, err = cli.Info(); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if infoResp.StatusCode != 200 {
|
||||||
|
err = fmt.Errorf("info es7 status=%d", infoResp.StatusCode)
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
cliCh <- cli
|
||||||
|
}
|
||||||
|
|
||||||
|
go ncFunc([]string{address}, urlUsername, urlPassword)
|
||||||
|
timeout := util.TimeoutCtx(ctx, 10)
|
||||||
|
|
||||||
|
select {
|
||||||
|
case <-timeout.Done():
|
||||||
|
return nil, fmt.Errorf("dial es=%s err=%v", address, context.DeadlineExceeded)
|
||||||
|
case client = <-cliCh:
|
||||||
|
return client, nil
|
||||||
|
case err = <-errCh:
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
136
xes/es6/read.go
Normal file
136
xes/es6/read.go
Normal file
@ -0,0 +1,136 @@
|
|||||||
|
package es6
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"context"
|
||||||
|
"encoding/json"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v6"
|
||||||
|
"github.com/elastic/go-elasticsearch/v6/esapi"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
"time"
|
||||||
|
)
|
||||||
|
|
||||||
|
func ReadData(ctx context.Context, client *elastic.Client, index string, size, max int, query map[string]any, source []string) (<-chan []*model.ESSource, <-chan error) {
|
||||||
|
var (
|
||||||
|
dataCh = make(chan []*model.ESSource)
|
||||||
|
errCh = make(chan error)
|
||||||
|
)
|
||||||
|
|
||||||
|
go func() {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
resp *esapi.Response
|
||||||
|
result = new(model.ESResponse)
|
||||||
|
scrollId string
|
||||||
|
total int
|
||||||
|
)
|
||||||
|
|
||||||
|
defer func() {
|
||||||
|
close(dataCh)
|
||||||
|
close(errCh)
|
||||||
|
|
||||||
|
if scrollId != "" {
|
||||||
|
bs, _ := json.Marshal(map[string]string{
|
||||||
|
"scroll_id": scrollId,
|
||||||
|
})
|
||||||
|
|
||||||
|
var (
|
||||||
|
rr *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
if rr, err = client.ClearScroll(
|
||||||
|
client.ClearScroll.WithContext(util.Timeout(3)),
|
||||||
|
client.ClearScroll.WithBody(bytes.NewReader(bs)),
|
||||||
|
); err != nil {
|
||||||
|
log.Warn("clear scroll id=%s err=%v", scrollId, err)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if rr.StatusCode != 200 {
|
||||||
|
log.Warn("clear scroll id=%s status=%d msg=%s", scrollId, rr.StatusCode, rr.String())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
if client == nil {
|
||||||
|
errCh <- fmt.Errorf("client is nil")
|
||||||
|
}
|
||||||
|
|
||||||
|
qs := []func(*esapi.SearchRequest){
|
||||||
|
client.Search.WithContext(util.TimeoutCtx(ctx, 20)),
|
||||||
|
client.Search.WithIndex(index),
|
||||||
|
client.Search.WithSize(size),
|
||||||
|
client.Search.WithFrom(0),
|
||||||
|
client.Search.WithScroll(time.Duration(120) * time.Second),
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(source) > 0 {
|
||||||
|
qs = append(qs, client.Search.WithSourceIncludes(source...))
|
||||||
|
}
|
||||||
|
|
||||||
|
if query != nil && len(query) > 0 {
|
||||||
|
queryBs, _ := json.Marshal(map[string]any{"query": query})
|
||||||
|
qs = append(qs, client.Search.WithBody(bytes.NewReader(queryBs)))
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp, err = client.Search(qs...); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp.StatusCode != 200 {
|
||||||
|
errCh <- fmt.Errorf("resp status=%d, resp=%s", resp.StatusCode, resp.String())
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
decoder := json.NewDecoder(resp.Body)
|
||||||
|
if err = decoder.Decode(result); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
scrollId = result.ScrollId
|
||||||
|
|
||||||
|
dataCh <- result.Hits.Hits
|
||||||
|
total += len(result.Hits.Hits)
|
||||||
|
|
||||||
|
if len(result.Hits.Hits) < size || (max > 0 && total >= max) {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
for {
|
||||||
|
if resp, err = client.Scroll(
|
||||||
|
client.Scroll.WithScrollID(scrollId),
|
||||||
|
client.Scroll.WithScroll(time.Duration(120)*time.Second),
|
||||||
|
); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
result = new(model.ESResponse)
|
||||||
|
|
||||||
|
decoder = json.NewDecoder(resp.Body)
|
||||||
|
if err = decoder.Decode(result); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp.StatusCode != 200 {
|
||||||
|
errCh <- fmt.Errorf("resp status=%d, resp=%s", resp.StatusCode, resp.String())
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
dataCh <- result.Hits.Hits
|
||||||
|
total += len(result.Hits.Hits)
|
||||||
|
|
||||||
|
if len(result.Hits.Hits) < size || (max > 0 && total >= max) {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
return dataCh, errCh
|
||||||
|
}
|
85
xes/es6/write.go
Normal file
85
xes/es6/write.go
Normal file
@ -0,0 +1,85 @@
|
|||||||
|
package es6
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"context"
|
||||||
|
"encoding/json"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v6"
|
||||||
|
"github.com/elastic/go-elasticsearch/v6/esutil"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
)
|
||||||
|
|
||||||
|
func WriteData(ctx context.Context, client *elastic.Client, index string, docsCh <-chan []*model.ESSource, logs ...log.WroteLogger) error {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
indexer esutil.BulkIndexer
|
||||||
|
total = 0
|
||||||
|
)
|
||||||
|
|
||||||
|
for {
|
||||||
|
select {
|
||||||
|
case <-ctx.Done():
|
||||||
|
return ctx.Err()
|
||||||
|
case docs, ok := <-docsCh:
|
||||||
|
if !ok {
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(docs) == 0 {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
count := 0
|
||||||
|
|
||||||
|
if indexer, err = esutil.NewBulkIndexer(esutil.BulkIndexerConfig{
|
||||||
|
Client: client,
|
||||||
|
Index: index,
|
||||||
|
ErrorTrace: true,
|
||||||
|
OnError: func(ctx context.Context, err error) {
|
||||||
|
|
||||||
|
},
|
||||||
|
}); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, doc := range docs {
|
||||||
|
var bs []byte
|
||||||
|
|
||||||
|
if bs, err = json.Marshal(doc.Content); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if err = indexer.Add(context.Background(), esutil.BulkIndexerItem{
|
||||||
|
Action: "index",
|
||||||
|
Index: index,
|
||||||
|
DocumentID: doc.DocId,
|
||||||
|
DocumentType: "_doc",
|
||||||
|
Body: bytes.NewReader(bs),
|
||||||
|
OnFailure: func(ctx context.Context, item esutil.BulkIndexerItem, item2 esutil.BulkIndexerResponseItem, bulkErr error) {
|
||||||
|
},
|
||||||
|
}); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
count++
|
||||||
|
}
|
||||||
|
|
||||||
|
total += count
|
||||||
|
|
||||||
|
if err = indexer.Close(ctx); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
stats := indexer.Stats()
|
||||||
|
if stats.NumFailed > 0 {
|
||||||
|
return fmt.Errorf("write to es failed_count=%d bulk_count=%d", stats.NumFailed, count)
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(logs) > 0 && logs[0] != nil {
|
||||||
|
logs[0].Info("Dump: succeed=%d total=%d docs succeed!!!", count, total)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
85
xes/es7/client.go
Normal file
85
xes/es7/client.go
Normal file
@ -0,0 +1,85 @@
|
|||||||
|
package es7
|
||||||
|
|
||||||
|
import (
|
||||||
|
"context"
|
||||||
|
"crypto/tls"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v7"
|
||||||
|
"github.com/elastic/go-elasticsearch/v7/esapi"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
|
"net"
|
||||||
|
"net/http"
|
||||||
|
"net/url"
|
||||||
|
"time"
|
||||||
|
)
|
||||||
|
|
||||||
|
func NewClient(ctx context.Context, url *url.URL) (*elastic.Client, error) {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
urlUsername string
|
||||||
|
urlPassword string
|
||||||
|
client *elastic.Client
|
||||||
|
errCh = make(chan error)
|
||||||
|
cliCh = make(chan *elastic.Client)
|
||||||
|
address = fmt.Sprintf("%s://%s", url.Scheme, url.Host)
|
||||||
|
)
|
||||||
|
|
||||||
|
if url.User != nil {
|
||||||
|
urlUsername = url.User.Username()
|
||||||
|
if p, ok := url.User.Password(); ok {
|
||||||
|
urlPassword = p
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
ncFunc := func(endpoints []string, username, password string) {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
cli *elastic.Client
|
||||||
|
infoResp *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
if cli, err = elastic.NewClient(
|
||||||
|
elastic.Config{
|
||||||
|
Addresses: endpoints,
|
||||||
|
Username: username,
|
||||||
|
Password: password,
|
||||||
|
CACert: nil,
|
||||||
|
RetryOnStatus: []int{429},
|
||||||
|
MaxRetries: 3,
|
||||||
|
RetryBackoff: nil,
|
||||||
|
Transport: &http.Transport{
|
||||||
|
TLSClientConfig: &tls.Config{InsecureSkipVerify: true},
|
||||||
|
DialContext: (&net.Dialer{Timeout: 10 * time.Second}).DialContext,
|
||||||
|
},
|
||||||
|
},
|
||||||
|
); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if infoResp, err = cli.Info(); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if infoResp.StatusCode != 200 {
|
||||||
|
err = fmt.Errorf("info es7 status=%d", infoResp.StatusCode)
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
cliCh <- cli
|
||||||
|
}
|
||||||
|
|
||||||
|
go ncFunc([]string{address}, urlUsername, urlPassword)
|
||||||
|
timeout := util.TimeoutCtx(ctx, 10)
|
||||||
|
|
||||||
|
select {
|
||||||
|
case <-timeout.Done():
|
||||||
|
return nil, fmt.Errorf("dial es=%s err=%v", address, context.DeadlineExceeded)
|
||||||
|
case client = <-cliCh:
|
||||||
|
return client, nil
|
||||||
|
case err = <-errCh:
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
136
xes/es7/read.go
Normal file
136
xes/es7/read.go
Normal file
@ -0,0 +1,136 @@
|
|||||||
|
package es7
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"context"
|
||||||
|
"encoding/json"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v7"
|
||||||
|
"github.com/elastic/go-elasticsearch/v7/esapi"
|
||||||
|
"github.com/loveuer/esgo2dump/internal/util"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
"time"
|
||||||
|
)
|
||||||
|
|
||||||
|
func ReadData(ctx context.Context, client *elastic.Client, index string, size, max int, query map[string]any, source []string) (<-chan []*model.ESSource, <-chan error) {
|
||||||
|
var (
|
||||||
|
dataCh = make(chan []*model.ESSource)
|
||||||
|
errCh = make(chan error)
|
||||||
|
)
|
||||||
|
|
||||||
|
go func() {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
resp *esapi.Response
|
||||||
|
result = new(model.ESResponse)
|
||||||
|
scrollId string
|
||||||
|
total int
|
||||||
|
)
|
||||||
|
|
||||||
|
defer func() {
|
||||||
|
close(dataCh)
|
||||||
|
close(errCh)
|
||||||
|
|
||||||
|
if scrollId != "" {
|
||||||
|
bs, _ := json.Marshal(map[string]string{
|
||||||
|
"scroll_id": scrollId,
|
||||||
|
})
|
||||||
|
|
||||||
|
var (
|
||||||
|
rr *esapi.Response
|
||||||
|
)
|
||||||
|
|
||||||
|
if rr, err = client.ClearScroll(
|
||||||
|
client.ClearScroll.WithContext(util.Timeout(3)),
|
||||||
|
client.ClearScroll.WithBody(bytes.NewReader(bs)),
|
||||||
|
); err != nil {
|
||||||
|
log.Warn("clear scroll id=%s err=%v", scrollId, err)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if rr.StatusCode != 200 {
|
||||||
|
log.Warn("clear scroll id=%s status=%d msg=%s", scrollId, rr.StatusCode, rr.String())
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
if client == nil {
|
||||||
|
errCh <- fmt.Errorf("client is nil")
|
||||||
|
}
|
||||||
|
|
||||||
|
qs := []func(*esapi.SearchRequest){
|
||||||
|
client.Search.WithContext(util.TimeoutCtx(ctx, 20)),
|
||||||
|
client.Search.WithIndex(index),
|
||||||
|
client.Search.WithSize(size),
|
||||||
|
client.Search.WithFrom(0),
|
||||||
|
client.Search.WithScroll(time.Duration(120) * time.Second),
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(source) > 0 {
|
||||||
|
qs = append(qs, client.Search.WithSourceIncludes(source...))
|
||||||
|
}
|
||||||
|
|
||||||
|
if query != nil && len(query) > 0 {
|
||||||
|
queryBs, _ := json.Marshal(map[string]any{"query": query})
|
||||||
|
qs = append(qs, client.Search.WithBody(bytes.NewReader(queryBs)))
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp, err = client.Search(qs...); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp.StatusCode != 200 {
|
||||||
|
errCh <- fmt.Errorf("resp status=%d, resp=%s", resp.StatusCode, resp.String())
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
decoder := json.NewDecoder(resp.Body)
|
||||||
|
if err = decoder.Decode(result); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
scrollId = result.ScrollId
|
||||||
|
|
||||||
|
dataCh <- result.Hits.Hits
|
||||||
|
total += len(result.Hits.Hits)
|
||||||
|
|
||||||
|
if len(result.Hits.Hits) < size || (max > 0 && total >= max) {
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
for {
|
||||||
|
if resp, err = client.Scroll(
|
||||||
|
client.Scroll.WithScrollID(scrollId),
|
||||||
|
client.Scroll.WithScroll(time.Duration(120)*time.Second),
|
||||||
|
); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
result = new(model.ESResponse)
|
||||||
|
|
||||||
|
decoder = json.NewDecoder(resp.Body)
|
||||||
|
if err = decoder.Decode(result); err != nil {
|
||||||
|
errCh <- err
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
if resp.StatusCode != 200 {
|
||||||
|
errCh <- fmt.Errorf("resp status=%d, resp=%s", resp.StatusCode, resp.String())
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
dataCh <- result.Hits.Hits
|
||||||
|
total += len(result.Hits.Hits)
|
||||||
|
|
||||||
|
if len(result.Hits.Hits) < size || (max > 0 && total >= max) {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}()
|
||||||
|
|
||||||
|
return dataCh, errCh
|
||||||
|
}
|
84
xes/es7/write.go
Normal file
84
xes/es7/write.go
Normal file
@ -0,0 +1,84 @@
|
|||||||
|
package es7
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"context"
|
||||||
|
"encoding/json"
|
||||||
|
"fmt"
|
||||||
|
elastic "github.com/elastic/go-elasticsearch/v7"
|
||||||
|
"github.com/elastic/go-elasticsearch/v7/esutil"
|
||||||
|
"github.com/loveuer/esgo2dump/log"
|
||||||
|
"github.com/loveuer/esgo2dump/model"
|
||||||
|
)
|
||||||
|
|
||||||
|
func WriteData(ctx context.Context, client *elastic.Client, index string, docsCh <-chan []*model.ESSource, logs ...log.WroteLogger) error {
|
||||||
|
var (
|
||||||
|
err error
|
||||||
|
indexer esutil.BulkIndexer
|
||||||
|
total int
|
||||||
|
)
|
||||||
|
|
||||||
|
for {
|
||||||
|
select {
|
||||||
|
case <-ctx.Done():
|
||||||
|
return ctx.Err()
|
||||||
|
case docs, ok := <-docsCh:
|
||||||
|
if !ok {
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(docs) == 0 {
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
count := 0
|
||||||
|
|
||||||
|
if indexer, err = esutil.NewBulkIndexer(esutil.BulkIndexerConfig{
|
||||||
|
Client: client,
|
||||||
|
Index: index,
|
||||||
|
ErrorTrace: true,
|
||||||
|
OnError: func(ctx context.Context, err error) {
|
||||||
|
|
||||||
|
},
|
||||||
|
}); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
for _, doc := range docs {
|
||||||
|
var bs []byte
|
||||||
|
|
||||||
|
if bs, err = json.Marshal(doc.Content); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
if err = indexer.Add(context.Background(), esutil.BulkIndexerItem{
|
||||||
|
Action: "index",
|
||||||
|
Index: index,
|
||||||
|
DocumentID: doc.DocId,
|
||||||
|
Body: bytes.NewReader(bs),
|
||||||
|
OnFailure: func(ctx context.Context, item esutil.BulkIndexerItem, item2 esutil.BulkIndexerResponseItem, bulkErr error) {
|
||||||
|
},
|
||||||
|
}); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
count++
|
||||||
|
}
|
||||||
|
|
||||||
|
total += count
|
||||||
|
|
||||||
|
if err = indexer.Close(ctx); err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
stats := indexer.Stats()
|
||||||
|
if stats.NumFailed > 0 {
|
||||||
|
return fmt.Errorf("write to es failed_count=%d bulk_count=%d", stats.NumFailed, count)
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(logs) > 0 && logs[0] != nil {
|
||||||
|
logs[0].Info("Dump: succeed=%d total=%d docs succeed!!!", count, total)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
||||||
|
}
|
Reference in New Issue
Block a user