Source Salesforce: fix pagination in REST API streams #9151

augan-rymkhan · 2021-12-28T12:16:42Z

What

Resolves 9136
Salesforce returns 1000 records in response for some streams. As page_size = 2000 this condition is not met in this case in next_page_token method. So that user gets only the first 1000 records, as the method returns None.

How

The main change is start using native Salesforce pagination in REST API streams.
If the initial query (REST API) returns only part of the results, the end of the response will contain a field called nextRecordsUrl. In such cases, request the next batch of records using nextRecordsUrl and repeat until all records have been retrieved. For more info go here.
The solution will work only for REST API.
BULK API stream should work as before.

This change is

augan-rymkhan · 2021-12-28T12:43:10Z

/test connector=connectors/source-salesforce

🕑 connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1630501517
❌ connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1630501517
🐛 https://gradle.com/s/obs545k4iqipo

augan-rymkhan · 2021-12-29T16:10:23Z

I found that some streams have problem with native pagination on Salesforce side.
For example:
Stream: PermissionSetTabSetting
TotalSize: 17513
Actual returned records: 4780

The problem is totalSize returned in result does not always match to the actual number of records returned.

Today I also found that, BULK API reads 4780 records from PermissionSetTabSetting stream too. I assume, TotalSize value might be incorrect. So, I completed the implementation provided in this PR.

augan-rymkhan · 2021-12-30T11:23:37Z

/test connector=connectors/source-salesforce

🕑 connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1637295218
❌ connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1637295218
🐛 https://gradle.com/s/jsgcbmzounj4m
Python short test summary info:

=========================== short test summary info ============================
FAILED test_core.py::TestBasicRead::test_read[inputs1] - docker.errors.Contai...
FAILED test_full_refresh.py::TestFullRefresh::test_sequential_reads[inputs1]
FAILED test_incremental.py::TestIncremental::test_two_sequential_reads[inputs1]
FAILED test_incremental.py::TestIncremental::test_state_with_abnormally_large_values[inputs1]
=================== 4 failed, 17 passed in 124.54s (0:02:04) ===================

augan-rymkhan · 2021-12-30T17:33:53Z

/test connector=connectors/source-salesforce

🕑 connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1638267997
❌ connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1638267997
🐛 https://gradle.com/s/4thvlkcpcvjm6
Python short test summary info:

=========================== short test summary info ============================
FAILED test_incremental.py::TestIncremental::test_two_sequential_reads[inputs1]
FAILED test_incremental.py::TestIncremental::test_state_with_abnormally_large_values[inputs0]
FAILED test_incremental.py::TestIncremental::test_state_with_abnormally_large_values[inputs1]
=================== 3 failed, 18 passed in 819.43s (0:13:39) ===================

augan-rymkhan · 2022-01-04T07:24:30Z

/test connector=connectors/source-salesforce

🕑 connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1652557572
✅ connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1652557572
Python tests coverage:

	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                                 Stmts   Miss  Cover
	 ------------------------------------------------------------------------
	 source_acceptance_test/__init__.py                       2      0   100%
	 source_acceptance_test/base.py                          10      4    60%
	 source_acceptance_test/config.py                        74      6    92%
	 source_acceptance_test/conftest.py                     109    109     0%
	 source_acceptance_test/plugin.py                        47     47     0%
	 source_acceptance_test/tests/__init__.py                 4      0   100%
	 source_acceptance_test/tests/test_core.py              242     96    60%
	 source_acceptance_test/tests/test_full_refresh.py       38      0   100%
	 source_acceptance_test/tests/test_incremental.py        69     38    45%
	 source_acceptance_test/utils/__init__.py                 6      0   100%
	 source_acceptance_test/utils/asserts.py                 37      2    95%
	 source_acceptance_test/utils/common.py                  54     17    69%
	 source_acceptance_test/utils/compare.py                 62     23    63%
	 source_acceptance_test/utils/connector_runner.py       110     48    56%
	 source_acceptance_test/utils/json_schema_helper.py     115     14    88%
	 ------------------------------------------------------------------------
	 TOTAL                                                  979    404    59%
	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                 Stmts   Miss  Cover
	 --------------------------------------------------------
	 source_salesforce/__init__.py            2      0   100%
	 source_salesforce/api.py               122     29    76%
	 source_salesforce/exceptions.py          1      0   100%
	 source_salesforce/rate_limiting.py      22      6    73%
	 source_salesforce/source.py             57     20    65%
	 source_salesforce/streams.py           240    147    39%
	 source_salesforce/utils.py               8      7    12%
	 --------------------------------------------------------
	 TOTAL                                  452    209    54%
	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                 Stmts   Miss  Cover
	 --------------------------------------------------------
	 source_salesforce/__init__.py            2      0   100%
	 source_salesforce/api.py               122     47    61%
	 source_salesforce/exceptions.py          1      0   100%
	 source_salesforce/rate_limiting.py      22      6    73%
	 source_salesforce/source.py             57     24    58%
	 source_salesforce/streams.py           240     59    75%
	 source_salesforce/utils.py               8      0   100%
	 --------------------------------------------------------
	 TOTAL                                  452    136    70%

augan-rymkhan · 2022-01-14T09:45:25Z

/test connector=connectors/source-salesforce

augan-rymkhan · 2022-01-14T14:01:56Z

After tests successfully passed, only comments and unit test were added, but the last test run did not started.
Also rate limit is reached, I will run again after limit is reset. PR is ready for code review.

augan-rymkhan · 2022-01-14T17:45:01Z

/test connector=connectors/source-salesforce

augan-rymkhan · 2022-01-17T08:30:51Z

/test connector=connectors/source-salesforce

🕑 connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1706977536
✅ connectors/source-salesforce https://github.com/airbytehq/airbyte/actions/runs/1706977536
Python tests coverage:

	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                                 Stmts   Miss  Cover
	 ------------------------------------------------------------------------
	 source_acceptance_test/__init__.py                       2      0   100%
	 source_acceptance_test/base.py                          10      4    60%
	 source_acceptance_test/config.py                        74      6    92%
	 source_acceptance_test/conftest.py                     109    109     0%
	 source_acceptance_test/plugin.py                        47     47     0%
	 source_acceptance_test/tests/__init__.py                 4      0   100%
	 source_acceptance_test/tests/test_core.py              242     96    60%
	 source_acceptance_test/tests/test_full_refresh.py       38      0   100%
	 source_acceptance_test/tests/test_incremental.py        69     38    45%
	 source_acceptance_test/utils/__init__.py                 6      0   100%
	 source_acceptance_test/utils/asserts.py                 37      2    95%
	 source_acceptance_test/utils/common.py                  54     17    69%
	 source_acceptance_test/utils/compare.py                 62     23    63%
	 source_acceptance_test/utils/connector_runner.py       110     48    56%
	 source_acceptance_test/utils/json_schema_helper.py     115     14    88%
	 ------------------------------------------------------------------------
	 TOTAL                                                  979    404    59%
	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                 Stmts   Miss  Cover
	 --------------------------------------------------------
	 source_salesforce/__init__.py            2      0   100%
	 source_salesforce/api.py               122     29    76%
	 source_salesforce/exceptions.py          1      0   100%
	 source_salesforce/rate_limiting.py      22      6    73%
	 source_salesforce/source.py             57     20    65%
	 source_salesforce/streams.py           243    150    38%
	 source_salesforce/utils.py               8      7    12%
	 --------------------------------------------------------
	 TOTAL                                  455    212    53%
	 ---------- coverage: platform linux, python 3.8.10-final-0 -----------
	 Name                                 Stmts   Miss  Cover
	 --------------------------------------------------------
	 source_salesforce/__init__.py            2      0   100%
	 source_salesforce/api.py               122     47    61%
	 source_salesforce/exceptions.py          1      0   100%
	 source_salesforce/rate_limiting.py      22      6    73%
	 source_salesforce/source.py             57     24    58%
	 source_salesforce/streams.py           243     42    83%
	 source_salesforce/utils.py               8      0   100%
	 --------------------------------------------------------
	 TOTAL                                  455    119    74%

vitaliizazmic

Could you please provide more detail about changes.

augan-rymkhan · 2022-01-18T04:39:00Z