안단테 안단테

머하웃 완벽 가이드) - mahout vectordump 인자값 본문

IT 기술/BigData

머하웃 완벽 가이드) - mahout vectordump 인자값

안단테에 2023. 2. 2. 13:28
728x90
반응형

Usage:

 [--input <input> --output <output> --useKey <useKey> --printKey <printKey>

--dictionary <dictionary> --dictionaryType <dictionaryType> --csv <csv>

--namesAsComments <namesAsComments> --nameOnly <nameOnly> --sortVectors

<sortVectors> --quiet <quiet> --sizeOnly <sizeOnly> --numItems <numItems>

--vectorSize <vectorSize> --filter <filter1> [<filter2> ...] --help --tempDir

<tempDir> --startPhase <startPhase> --endPhase <endPhase>]

Job-Specific Options:

  --input (-i) input                        Path to job input directory.

  --output (-o) output                      The directory pathname for output.

  --useKey (-u) useKey                      If the Key is a vector than dump

                                            that instead

  --printKey (-p) printKey                  Print out the key as well,

                                            delimited by tab (or the value if

                                            useKey is true

  --dictionary (-d) dictionary              The dictionary file.

  --dictionaryType (-dt) dictionaryType     The dictionary file type

                                            (text|seqfile)

  --csv (-c) csv                            Output the Vector as CSV.

                                            Otherwise it substitutes in the

                                            terms for vector cell entries

  --namesAsComments (-n) namesAsComments    If using CSV output, optionally add

                                            a comment line for each NamedVector

                                            (if the vector is one) printing out

                                            the name

  --nameOnly (-N) nameOnly                  Use the name as the value for each

                                            NamedVector (skip other vectors)

  --sortVectors (-sort) sortVectors         Sort output key/value pairs of the

                                            vector entries in abs magnitude

                                            descending order

  --quiet (-q) quiet                        Print only file contents

  --sizeOnly (-sz) sizeOnly                 Dump only the size of the vector

  --numItems (-ni) numItems                 Output at most <n> vecors

  --vectorSize (-vs) vectorSize             Truncate vectors to <vs> length

                                            when dumping (most useful when in

                                            conjunction with -sort

  --filter (-fi) filter [filter ...]        Only dump out those vectors whose

                                            name matches the filter.  Multiple

                                            items may be specified by repeating

                                            the argument.

  --help (-h)                               Print out help

  --tempDir tempDir                         Intermediate output directory

  --startPhase startPhase                   First phase to run

  --endPhase endPhase                       Last phase to run

728x90
반응형
Comments