Skip to content

Chinese date is parsed into year 1 #866

Open
@novellus

Description

@novellus

The following straightforward string parses incorrectly

>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 7, 58, 587351)

Furthermore, the result is not consistent

>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 11, 140651)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 11, 925638)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 12, 500666)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 12, 930812)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 13, 385392)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 13, 730447)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 14, 705554)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 15, 165488)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 15, 575601)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 15, 930604)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 22, 46657)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 22, 705704)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 23, 805362)
>>> dateparser.parse('2019 年 10 月 30 日')
datetime.datetime(1, 2, 8, 22, 12, 24, 250476)

Expected result: datetime.datetime(2019, 10, 30, 0, 0)

Hypothesis: this string is parsed internally as "2019 years 10 months 30 days ago", where ago is the incorrect part.

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type: Bug - LanguageSubtype of bug, related to language data

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions