Entity Matching by Similarity Join
 
Loading...
Searching...
No Matches
config.h File Reference
#include <cstddef>

Go to the source code of this file.

Macros

#define PARQUET_PREFIX_MIN_LENGTH   4
 
#define REPORT_TABLE_IN_BUFFER
 
#define REPORT_TOKEN_IN_BUFFER
 
#define NORMALIZE_STRATEGY   1
 
#define SKIP_NO_ALPHANUMERIC   0
 
#define MAXTHREADNUM   160
 
#define MAINTAIN_VALUE   1
 
#define MAINTAIN_VALUE_OVLP   1
 
#define MAINTAIN_VALUE_EDIT   0
 
#define EARLY_TERMINATE   0
 
#define MAX_PAIR_SIZE   10000000
 
#define DEDUPLICATE   1
 
#define MAX_PAIR_SIZE_SERIAL   1000000000
 
#define APPROXIMATE   0
 
#define TIMER_ON   0
 
#define VERIFY_PREFIX   0
 
#define DROP_EMPTY   1
 
#define LEAVE_EXACT_MATCH   0
 
#define REPORT_STR_COUNT   0
 
#define BRUTE_FORCE   1
 
#define OUTPUT_DUP   0
 
#define PACK(x, y)
 
#define PRIME   2017
 
#define EPS   1e-5
 
#define NEG   -1
 
#define INF   100000000
 
#define MAX_LINE_LENGTH   100000
 
#define CACHE_SIZE   5
 
#define PART_COE   1
 
#define APPEND_EMPTY   0
 
#define MAX_EMPTY_SIZE   1000000
 
#define RESIZE_DATA   0
 
#define VERSION   1
 
#define RATIO   0.005
 
#define TIMES   200
 
#define BRUTEFORCE_COMB   0
 
#define PREPROCESS_TIMER_ON   1
 
#define REPORT_INDEX   0
 
#define REPORT_BINARY   0
 
#define REPORT_LIST   0
 
#define LIMIT_INV_SIZE   1
 
#define MAX_INV_SIZE   100000
 
#define APPROXIMATE_OVLP   0
 
#define SHARING_PREFIX   1
 
#define OVLP_STRATEGY   1
 
#define USING_CRITICAL   0
 
#define USING_PARALLEL   0
 
#define MAX_TOTAL_SIZE   1000000000
 
#define PRINT_RULES   0
 
#define EXPORT_MISS   0
 
#define VERIFY_JOIN
 
#define MAX_BITSET_LENGTH   10000000
 

Typedefs

using TokenLen = unsigned int
 

Variables

constexpr size_t stringHashNumber = 31
 
constexpr size_t modNumber = 1000000007
 

Macro Definition Documentation

◆ APPEND_EMPTY

#define APPEND_EMPTY   0

◆ APPROXIMATE

#define APPROXIMATE   0

◆ APPROXIMATE_OVLP

#define APPROXIMATE_OVLP   0

◆ BRUTE_FORCE

#define BRUTE_FORCE   1

◆ BRUTEFORCE_COMB

#define BRUTEFORCE_COMB   0

◆ CACHE_SIZE

#define CACHE_SIZE   5

◆ DEDUPLICATE

#define DEDUPLICATE   1

◆ DROP_EMPTY

#define DROP_EMPTY   1

◆ EARLY_TERMINATE

#define EARLY_TERMINATE   0

◆ EPS

#define EPS   1e-5

◆ EXPORT_MISS

#define EXPORT_MISS   0

◆ INF

#define INF   100000000

◆ LEAVE_EXACT_MATCH

#define LEAVE_EXACT_MATCH   0

◆ LIMIT_INV_SIZE

#define LIMIT_INV_SIZE   1

◆ MAINTAIN_VALUE

#define MAINTAIN_VALUE   1

◆ MAINTAIN_VALUE_EDIT

#define MAINTAIN_VALUE_EDIT   0

◆ MAINTAIN_VALUE_OVLP

#define MAINTAIN_VALUE_OVLP   1

◆ MAX_BITSET_LENGTH

#define MAX_BITSET_LENGTH   10000000

◆ MAX_EMPTY_SIZE

#define MAX_EMPTY_SIZE   1000000

◆ MAX_INV_SIZE

#define MAX_INV_SIZE   100000

◆ MAX_LINE_LENGTH

#define MAX_LINE_LENGTH   100000

◆ MAX_PAIR_SIZE

#define MAX_PAIR_SIZE   10000000

◆ MAX_PAIR_SIZE_SERIAL

#define MAX_PAIR_SIZE_SERIAL   1000000000

◆ MAX_TOTAL_SIZE

#define MAX_TOTAL_SIZE   1000000000

◆ MAXTHREADNUM

#define MAXTHREADNUM   160

◆ NEG

#define NEG   -1

◆ NORMALIZE_STRATEGY

#define NORMALIZE_STRATEGY   1

◆ OUTPUT_DUP

#define OUTPUT_DUP   0

◆ OVLP_STRATEGY

#define OVLP_STRATEGY   1

◆ PACK

#define PACK ( x,
y )
Value:
((x << 32) + y)

◆ PARQUET_PREFIX_MIN_LENGTH

#define PARQUET_PREFIX_MIN_LENGTH   4

◆ PART_COE

#define PART_COE   1

◆ PREPROCESS_TIMER_ON

#define PREPROCESS_TIMER_ON   1

◆ PRIME

#define PRIME   2017

◆ PRINT_RULES

#define PRINT_RULES   0

◆ RATIO

#define RATIO   0.005

◆ REPORT_BINARY

#define REPORT_BINARY   0

◆ REPORT_INDEX

#define REPORT_INDEX   0

◆ REPORT_LIST

#define REPORT_LIST   0

◆ REPORT_STR_COUNT

#define REPORT_STR_COUNT   0

◆ REPORT_TABLE_IN_BUFFER

#define REPORT_TABLE_IN_BUFFER

◆ REPORT_TOKEN_IN_BUFFER

#define REPORT_TOKEN_IN_BUFFER

◆ RESIZE_DATA

#define RESIZE_DATA   0

◆ SHARING_PREFIX

#define SHARING_PREFIX   1

◆ SKIP_NO_ALPHANUMERIC

#define SKIP_NO_ALPHANUMERIC   0

◆ TIMER_ON

#define TIMER_ON   0

◆ TIMES

#define TIMES   200

◆ USING_CRITICAL

#define USING_CRITICAL   0

◆ USING_PARALLEL

#define USING_PARALLEL   0

◆ VERIFY_JOIN

#define VERIFY_JOIN

◆ VERIFY_PREFIX

#define VERIFY_PREFIX   0

◆ VERSION

#define VERSION   1

Typedef Documentation

◆ TokenLen

using TokenLen = unsigned int

Variable Documentation

◆ modNumber

size_t modNumber = 1000000007
constexpr

◆ stringHashNumber

size_t stringHashNumber = 31
constexpr