File CrossRef.java

Branches:

176

Statements:

285

Methods:

Classes:

LOC:

1,101

NCLOC:

646

Total complexity:

133

Complexity density:

0.47

Statements/Method:

17.81

Methods/Class:

Average method complexity:

8.31

Classes

Class	Line #	Total Statements	Complexity	Uncovered Elements	TOTAL Coverage	Actions
CrossRef	47	285	133	275	0.423480142.3%

Class CrossRef

Class CrossRef	Line # 47	Total Statements 285	Complexity 133	Uncovered Elements 275	TOTAL Coverage 0.423480142.3%
CrossRef(SequenceI[],AlignmentI) CrossRef(SequenceI[],AlignmentI)	8080	2.02	2.02	1.01	0.75 0.7575%
findXrefSourcesForSequences(boolean) : List<String> findXrefSourcesForSequences(boolean) : List<String>	100100	9.09	3.03	1.01	0.9230769 0.923076992.3%
findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void findXrefSourcesForSequence(SequenceI,boolean,List<String>) : void	140140	9.09	2.02	3.03	0.72727275 0.7272727572.7%
addXrefsToSources(DBRefEntry[],List<String>) : void addXrefsToSources(DBRefEntry[],List<String>) : void	181181	5.05	3.03	0.00	1.0 1.0100%
findXrefSequences(String,boolean) : Alignment findXrefSequences(String,boolean) : Alignment	218218	58.058	31.031	36.036	0.64 0.6464%
retrieveCrossRef(List<DBRefEntry>,SequenceI,DBRefEntry[],boolean,AlignedCodonFrame) : void retrieveCrossRef(List<DBRefEntry>,SequenceI,DBRefEntry[],boolean,AlignedCodonFrame) : void	402402	25.025	10.010	39.039	0.0 0.00%
removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void removeAlreadyRetrievedSeqs(List<DBRefEntry>,boolean) : void	483483	10.010	3.03	14.014	0.0 0.00%
equals(Object) : boolean equals(Object) : boolean	633633	1.01	1.01	1.01	0.0 0.00%
importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean importCrossRefSeq(AlignedCodonFrame,List<SequenceI>,List<SequenceI>,SequenceI,SequenceI) : boolean	520520	46.046	15.015	68.068	0.0 0.00%
setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void setReverseMapping(SequenceI,DBRefEntry,AlignedCodonFrame) : void	677677	12.012	6.06	20.020	0.0 0.00%
findInDataset(DBRefEntry) : SequenceI findInDataset(DBRefEntry) : SequenceI	716716	18.018	13.013	12.012	0.6 0.660%
sameSequence(SequenceI,SequenceI) : boolean sameSequence(SequenceI,SequenceI) : boolean	775775	12.012	9.09	2.02	0.90909094 0.9090909490.9%
updateDbrefMappings(SequenceI,DBRefEntry[],SequenceI[],AlignedCodonFrame,boolean) : void updateDbrefMappings(SequenceI,DBRefEntry[],SequenceI[],AlignedCodonFrame,boolean) : void	815815	9.09	3.03	13.013	0.0 0.00%
constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean constructMapping(SequenceI,SequenceI,DBRefEntry,AlignedCodonFrame,boolean) : boolean	858858	25.025	12.012	43.043	0.0 0.00%
searchDatasetXrefs(boolean,SequenceI,DBRefEntry[],List<SequenceI>,AlignedCodonFrame) : boolean searchDatasetXrefs(boolean,SequenceI,DBRefEntry[],List<SequenceI>,AlignedCodonFrame) : boolean	948948	9.09	3.03	0.00	1.0 1.0100%
searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean) : boolean searchDataset(boolean,SequenceI,DBRefEntry,List<SequenceI>,AlignedCodonFrame,boolean) : boolean	997997	35.035	17.017	15.015	0.75409836 0.7540983675.4%

Contributing tests

This file is covered by 83 tests. .

Contributing tests

Test contribution	Test	Result
0.5010482	jalview.analysis.CrossRefTest.testFindXrefSequences_uniprotEmblManyToManyjalview.analysis.CrossRefTest.testFindXrefSequences_uniprotEmblManyToMany	3FAIL
0.3312369	jalview.analysis.CrossRefTest.testFindXrefSequences_forGeneAndTranscriptsjalview.analysis.CrossRefTest.testFindXrefSequences_forGeneAndTranscripts	3FAIL
0.25995806	jalview.analysis.CrossRefTest.testFindXrefSequences_withFetchjalview.analysis.CrossRefTest.testFindXrefSequences_withFetch	3FAIL
0.17190775	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotidejalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToNucleotide	1PASS
0.17190775	jalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProteinjalview.analysis.CrossRefTest.testFindXrefSequences_indirectDbrefToProtein	1PASS
0.16981132	jalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMapjalview.analysis.CrossRefTest.testFindXrefSequences_fromDbRefMap	1PASS
0.14675052	jalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDnajalview.analysis.CrossRefTest.testFindXrefSourcesForSequence_proteinToDna	1PASS
0.13626835	jalview.io.Jalview2xmlTests.testRNAStructureRecoveryjalview.io.Jalview2xmlTests.testRNAStructureRecovery	1PASS
0.13207547	jalview.io.Jalview2xmlTests.testStoreAndRecoverExpandedviewsjalview.io.Jalview2xmlTests.testStoreAndRecoverExpandedviews	1PASS
0.13207547	jalview.io.Jalview2xmlTests.gatherViewsHerejalview.io.Jalview2xmlTests.gatherViewsHere	1PASS
0.13207547	jalview.io.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettingsjalview.io.Jalview2xmlTests.testStoreAndRecoverReferenceSeqSettings	1PASS
0.13207547	jalview.io.Jalview2xmlTests.testCopyViewSettingsjalview.io.Jalview2xmlTests.testCopyViewSettings	1PASS
0.13207547	jalview.io.Jalview2xmlTests.viewRefPdbAnnotationjalview.io.Jalview2xmlTests.viewRefPdbAnnotation	1PASS
0.13207547	jalview.io.Jalview2xmlTests.noDuplicatePdbMappingsMadejalview.io.Jalview2xmlTests.noDuplicatePdbMappingsMade	1PASS
0.10691824	jalview.analysis.CrossRefTest.testSearchDatasetjalview.analysis.CrossRefTest.testSearchDataset	1PASS
0.06918239	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeaturejalview.analysis.scoremodels.FeatureDistanceModelTest.testFindFeatureAt_PointFeature	1PASS
0.06918239	jalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrandjalview.io.vcf.VCFLoaderTest.testDoLoad_reverseStrand	1PASS
0.06918239	jalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsqjalview.io.vcf.VCFLoaderTest.testDoLoad_vepCsq	1PASS
0.06918239	jalview.io.vcf.VCFLoaderTest.testDoLoadjalview.io.vcf.VCFLoaderTest.testDoLoad	1PASS
0.06918239	jalview.gui.AlignViewportTest.testDeregisterMapping_onCloseViewjalview.gui.AlignViewportTest.testDeregisterMapping_onCloseView	1PASS
0.06918239	jalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.ClustalxColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.064989515	jalview.ext.rbvi.chimera.ChimeraCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.rbvi.chimera.ChimeraCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.064989515	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommand_noFeaturesjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommand_noFeatures	1PASS
0.064989515	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModeljalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel	1PASS
0.064989515	jalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNonejalview.io.JSONFileTest.testBioJSONRoundTripWithColourSchemeNone	1PASS
0.064989515	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_withSelectionGroup	1PASS
0.064989515	jalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumnjalview.renderer.seqfeatures.FeatureRendererTest.testFindFeaturesAtColumn	1PASS
0.064989515	jalview.gui.AlignFrameTest.testNewView_colourThresholdsjalview.gui.AlignFrameTest.testNewView_colourThresholds	1PASS
0.064989515	jalview.io.FeaturesFileTest.testPrintJalviewFormatjalview.io.FeaturesFileTest.testPrintJalviewFormat	1PASS
0.064989515	jalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumnsjalview.ext.jmol.JmolCommandsTest.testGetColourBySequenceCommands_hiddenColumns	1PASS
0.064989515	jalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_withAnnotationsjalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_withAnnotations	1PASS
0.064989515	jalview.io.FeaturesFileTest.testParsejalview.io.FeaturesFileTest.testParse	1PASS
0.064989515	jalview.gui.AlignViewportTest.testSetGlobalColourSchemejalview.gui.AlignViewportTest.testSetGlobalColourScheme	1PASS
0.064989515	jalview.controller.AlignViewControllerTest.testFindColumnsWithFeaturejalview.controller.AlignViewControllerTest.testFindColumnsWithFeature	1PASS
0.064989515	jalview.io.gff.GffTests.testResolveExonerateGffjalview.io.gff.GffTests.testResolveExonerateGff	1PASS
0.064989515	jalview.gui.AlignViewportTest.testSetSelectionGroupjalview.gui.AlignViewportTest.testSetSelectionGroup	1PASS
0.064989515	jalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_fromScrolledjalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_fromScrolled	3FAIL
0.064989515	jalview.datamodel.AlignmentViewTest.testGetVisibleContigsjalview.datamodel.AlignmentViewTest.testGetVisibleContigs	1PASS
0.064989515	jalview.io.JalviewExportPropertiesTests.testImportExportPeriodGapsjalview.io.JalviewExportPropertiesTests.testImportExportPeriodGaps	1PASS
0.064989515	jalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplayjalview.renderer.seqfeatures.FeatureRendererTest.testFilterFeaturesForDisplay	1PASS
0.064989515	jalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessagejalview.gui.SeqPanelTest.testAmbiguousAminoAcidGetsStatusMessage	1PASS
0.064989515	jalview.renderer.seqfeatures.FeatureRendererTest.testGetColourjalview.renderer.seqfeatures.FeatureRendererTest.testGetColour	1PASS
0.064989515	jalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlightjalview.controller.AlignViewControllerTest.testSelectColumnsWithHighlight	1PASS
0.064989515	jalview.gui.AlignViewportTest.testShowOrDontShowOccupancyjalview.gui.AlignViewportTest.testShowOrDontShowOccupancy	1PASS
0.064989515	jalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testAddStrToSingleSeqViewJMol	1PASS
0.064989515	jalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnlyjalview.io.FeaturesFileTest.testParse_jalviewFeaturesOnly	1PASS
0.064989515	jalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_noAnnotationsjalview.gui.SeqCanvasTest.testCalculateWrappedGeometry_noAnnotations	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testSaveLoadFeatureColoursAndFiltersjalview.io.Jalview2xmlTests.testSaveLoadFeatureColoursAndFilters	1PASS
0.064989515	jalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMoljalview.ext.jmol.JmolViewerTest.testSingleSeqViewJMol	1PASS
0.064989515	jalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePositionjalview.gui.SeqPanelTest.testSetStatusReturnsNearestResiduePosition	1PASS
0.064989515	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParamsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances_withParams	1PASS
0.064989515	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumnjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_hiddenFirstColumn	1PASS
0.064989515	jalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeaturesjalview.renderer.seqfeatures.FeatureRendererTest.testFindAllFeatures	1PASS
0.064989515	jalview.io.FeaturesFileTest.simpleGff3FileLoaderjalview.io.FeaturesFileTest.simpleGff3FileLoader	1PASS
0.064989515	jalview.gui.AlignViewportTest.testDeregisterMapping_withReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withReference	1PASS
0.064989515	jalview.schemes.ColourSchemesTest.testGetColourSchemejalview.schemes.ColourSchemesTest.testGetColourScheme	1PASS
0.064989515	jalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGapsjalview.schemes.PIDColourSchemeTest.testFindColour_ignoreGaps	1PASS
0.064989515	jalview.gui.AlignFrameTest.testHideFeatureColumnsjalview.gui.AlignFrameTest.testHideFeatureColumns	1PASS
0.064989515	jalview.io.FeaturesFileTest.testParse_mixedJalviewGffjalview.io.FeaturesFileTest.testParse_mixedJalviewGff	1PASS
0.064989515	jalview.gui.AlignViewportTest.testDeregisterMapping_withNoReferencejalview.gui.AlignViewportTest.testDeregisterMapping_withNoReference	1PASS
0.064989515	jalview.gui.PaintRefresherTest.testGetAssociatedPanelsjalview.gui.PaintRefresherTest.testGetAssociatedPanels	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testStoreAndRecoverPDBEntryjalview.io.Jalview2xmlTests.testStoreAndRecoverPDBEntry	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqsjalview.io.Jalview2xmlTests.testStoreAndRecoverGroupRepSeqs	1PASS
0.064989515	jalview.gui.AlignViewportTest.testSetGetHasSearchResultsjalview.gui.AlignViewportTest.testSetGetHasSearchResults	1PASS
0.064989515	jalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignmentjalview.io.gff.ExonerateHelperTest.testAddExonerateGffToAlignment	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testTCoffeeScoresjalview.io.Jalview2xmlTests.testTCoffeeScores	1PASS
0.064989515	jalview.schemes.ClustalxColourSchemeTest.testFindColourjalview.schemes.ClustalxColourSchemeTest.testFindColour	1PASS
0.064989515	jalview.gui.AlignViewportTest.testUpdateConservation_qualityOnlyjalview.gui.AlignViewportTest.testUpdateConservation_qualityOnly	1PASS
0.064989515	jalview.renderer.ScaleRendererTest.testCalculateMarksjalview.renderer.ScaleRendererTest.testCalculateMarks	1PASS
0.064989515	jalview.gui.FeatureSettingsTest.testSaveLoadjalview.gui.FeatureSettingsTest.testSaveLoad	1PASS
0.064989515	jalview.io.FeaturesFileTest.testPrintGffFormatjalview.io.FeaturesFileTest.testPrintGffFormat	1PASS
0.064989515	jalview.gui.AlignViewportTest.testGetConsensusSeqjalview.gui.AlignViewportTest.testGetConsensusSeq	1PASS
0.064989515	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumnsjalview.analysis.scoremodels.FeatureDistanceModelTest.testFeatureScoreModel_HiddenColumns	1PASS
0.064989515	jalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotationjalview.io.AnnotatedPDBFileInputTest.testJalviewProjectRelocationAnnotation	1PASS
0.064989515	jalview.schemes.ColourSchemesTest.testRegisterColourSchemejalview.schemes.ColourSchemesTest.testRegisterColourScheme	1PASS
0.064989515	jalview.io.JSONFileTest.testGrpParsed_colourNonejalview.io.JSONFileTest.testGrpParsed_colourNone	1PASS
0.064989515	jalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistancesjalview.analysis.scoremodels.FeatureDistanceModelTest.testFindDistances	1PASS
0.064989515	jalview.io.FeaturesFileTest.testParse_pureGff3jalview.io.FeaturesFileTest.testParse_pureGff3	1PASS
0.064989515	jalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroupjalview.gui.PairwiseAlignmentPanelTest.testConstructor_noSelectionGroup	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testStoreAndRecoverColourThresholdsjalview.io.Jalview2xmlTests.testStoreAndRecoverColourThresholds	1PASS
0.064989515	jalview.io.Jalview2xmlTests.testColourByAnnotScoresjalview.io.Jalview2xmlTests.testColourByAnnotScores	1PASS
0.062893085	jalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefsjalview.analysis.CrossRefTest.testFindXrefSequences_noDbrefs	1PASS
0.044025157	jalview.analysis.CrossRefTest.testSameSequencejalview.analysis.CrossRefTest.testSameSequence	1PASS

Source view

* Jalview - A Sequence Alignment Editor and Viewer ($$Version-Rel$$)

* Copyright (C) $$Year-Rel$$ The Jalview Authors

* This file is part of Jalview.

* Jalview is free software: you can redistribute it and/or

* modify it under the terms of the GNU General Public License

* as published by the Free Software Foundation, either version 3

* of the License, or (at your option) any later version.

* Jalview is distributed in the hope that it will be useful, but

* WITHOUT ANY WARRANTY; without even the implied warranty

* of MERCHANTABILITY or FITNESS FOR A PARTICULAR

* PURPOSE. See the GNU General Public License for more details.

* You should have received a copy of the GNU General Public License

* along with Jalview. If not, see <http://www.gnu.org/licenses/>.

* The Jalview Authors are detailed in the 'AUTHORS' file.

package jalview.analysis;

import jalview.datamodel.AlignedCodonFrame;

import jalview.datamodel.Alignment;

import jalview.datamodel.AlignmentI;

import jalview.datamodel.DBRefEntry;

import jalview.datamodel.DBRefSource;

import jalview.datamodel.Mapping;

import jalview.datamodel.Sequence;

import jalview.datamodel.SequenceFeature;

import jalview.datamodel.SequenceI;

import jalview.util.DBRefUtils;

import jalview.util.MapList;

import jalview.ws.SequenceFetcherFactory;

import jalview.ws.seqfetcher.ASequenceFetcher;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

/**

* Functions for cross-referencing sequence databases.

* @author JimP

public class CrossRef

{

* the dataset of the alignment for which we are searching for

* cross-references; in some cases we may resolve xrefs by

* searching in the dataset

private AlignmentI dataset;

* the sequences for which we are seeking cross-references

private SequenceI[] fromSeqs;

/**

* matcher built from dataset

SequenceIdMatcher matcher;

/**

* sequences found by cross-ref searches to fromSeqs

List<SequenceI> rseqs;

/**

* Constructor

* @param seqs

* the sequences for which we are seeking cross-references

* @param ds

* the containing alignment dataset (may be searched to resolve

* cross-references)

387

public CrossRef(SequenceI[] seqs, AlignmentI ds)

{

387

fromSeqs = seqs;

387

dataset = ds.getDataset() == null ? ds : ds.getDataset();

}

/**

* Returns a list of distinct database sources for which sequences have either

* <ul>

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

* reference from another sequence in the dataset which has a cross-reference

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param dna

* - when true, cross-references *from* dna returned. When false,

* cross-references *from* protein are returned

* @return

100

379

public List<String> findXrefSourcesForSequences(boolean dna)

101

{

102

379

List<String> sources = new ArrayList<>();

103

379

for (SequenceI seq : fromSeqs)

104

{

105

4232

if (seq != null)

106

{

107

4232

findXrefSourcesForSequence(seq, dna, sources);

108

}

109

}

110

379

sources.remove(DBRefSource.EMBL); // hack to prevent EMBL xrefs resulting in

111

// redundant datasets

112

379

if (dna)

113

{

114

sources.remove(DBRefSource.ENSEMBL); // hack to prevent Ensembl and

115

// EnsemblGenomes xref option shown

116

// from cdna panel

117

sources.remove(DBRefSource.ENSEMBLGENOMES);

118

}

119

// redundant datasets

120

379

return sources;

}

/**

* Returns a list of distinct database sources for which a sequence has either

125

* <ul>

126

* <li>a (dna-to-protein or protein-to-dna) cross-reference</li>

127

* <li>an indirect cross-reference - a (dna-to-protein or protein-to-dna)

128

* reference from another sequence in the dataset which has a cross-reference

129

* to a direct DBRefEntry on the given sequence</li>

* </ul>

* @param seq

* the sequence whose dbrefs we are searching against

134

* @param fromDna

135

* when true, context is DNA - so sources identifying protein

136

* products will be returned.

137

* @param sources

138

* a list of sources to add matches to

139

140

4232

void findXrefSourcesForSequence(SequenceI seq, boolean fromDna,

141

List<String> sources)

142

{

143

144

* first find seq's xrefs (dna-to-peptide or peptide-to-dna)

145

146

4232

DBRefEntry[] rfs = DBRefUtils.selectDbRefs(!fromDna, seq.getDBRefs());

147

4232

addXrefsToSources(rfs, sources);

148

4232

if (dataset != null)

149

{

150

151

* find sequence's direct (dna-to-dna, peptide-to-peptide) xrefs

152

153

4232

DBRefEntry[] lrfs = DBRefUtils.selectDbRefs(fromDna, seq.getDBRefs());

154

4232

List<SequenceI> foundSeqs = new ArrayList<>();

155

156

157

* find sequences in the alignment which xref one of these DBRefs

158

* i.e. is xref-ed to a common sequence identifier

159

160

4232

searchDatasetXrefs(fromDna, seq, lrfs, foundSeqs, null);

161

162

163

* add those sequences' (dna-to-peptide or peptide-to-dna) dbref sources

164

165

4232

for (SequenceI rs : foundSeqs)

166

{

167

DBRefEntry[] xrs = DBRefUtils.selectDbRefs(!fromDna,

168

rs.getDBRefs());

169

addXrefsToSources(xrs, sources);

}

}

}

/**

* Helper method that adds the source identifiers of some cross-references to

176

* a (non-redundant) list of database sources

* @param xrefs

* @param sources

4232

void addXrefsToSources(DBRefEntry[] xrefs, List<String> sources)

182

{

183

4232

if (xrefs != null)

184

{

185

for (DBRefEntry ref : xrefs)

186

{

187

188

* avoid duplication e.g. ENSEMBL and Ensembl

189

190

String source = DBRefUtils.getCanonicalName(ref.getSource());

191

if (!sources.contains(source))

{

sources.add(source);

}

}

}

}

/**

* Attempts to find cross-references from the sequences provided in the

201

* constructor to the given source database. Cross-references may be found

202

* <ul>

203

* <li>in dbrefs on the sequence which hold a mapping to a sequence

204

* <ul>

205

* <li>provided with a fetched sequence (e.g. ENA translation), or</li>

206

* <li>populated previously after getting cross-references</li>

207

* </ul>

208

* <li>as other sequences in the alignment which share a dbref identifier with

209

* the sequence</li>

210

* <li>by fetching from the remote database</li>

211

* </ul>

212

* The cross-referenced sequences, and mappings to them, are added to the

* alignment dataset.

* @param source

* @return cross-referenced sequences (as dataset sequences)

217

218

public Alignment findXrefSequences(String source, boolean fromDna)

219

{

220

221

rseqs = new ArrayList<>();

222

AlignedCodonFrame cf = new AlignedCodonFrame();

223

matcher = new SequenceIdMatcher(dataset.getSequences());

224

225

for (SequenceI seq : fromSeqs)

226

{

227

SequenceI dss = seq;

228

while (dss.getDatasetSequence() != null)

229

{

230

dss = dss.getDatasetSequence();

231

}

232

boolean found = false;

233

DBRefEntry[] xrfs = DBRefUtils.selectDbRefs(!fromDna,

234

dss.getDBRefs());

235

// ENST & ENSP comes in to both Protein and nucleotide, so we need to

236

// filter them

237

// out later.

238

if ((xrfs == null || xrfs.length == 0) && dataset != null)

239

{

240

241

* found no suitable dbrefs on sequence - look for sequences in the

242

* alignment which share a dbref with this one

243

244

DBRefEntry[] lrfs = DBRefUtils.selectDbRefs(fromDna,

seq.getDBRefs());

* find sequences (except this one!), of complementary type,

249

* which have a dbref to an accession id for this sequence,

250

* and add them to the results

251

252

found = searchDatasetXrefs(fromDna, dss, lrfs, rseqs, cf);

253

}

254

if (xrfs == null && !found)

255

{

256

257

* no dbref to source on this sequence or matched

258

* complementary sequence in the dataset

continue;

}

List<DBRefEntry> sourceRefs = DBRefUtils.searchRefsForSource(xrfs,

263

source);

264

Iterator<DBRefEntry> refIterator = sourceRefs.iterator();

265

// At this point, if we are retrieving Ensembl, we still don't filter out

266

// ENST when looking for protein crossrefs.

267

while (refIterator.hasNext())

268

{

269

DBRefEntry xref = refIterator.next();

270

found = false;

271

// we're only interested in coding cross-references, not

272

// locus->transcript

273

if (xref.hasMap() && xref.getMap().getMap().isTripletMap())

274

{

275

SequenceI mappedTo = xref.getMap().getTo();

276

if (mappedTo != null)

277

{

278

279

* dbref contains the sequence it maps to; add it to the

280

* results unless we have done so already (could happen if

281

* fetching xrefs for sequences which have xrefs in common)

282

* for example: UNIPROT {P0CE19, P0CE20} -> EMBL {J03321, X06707}

found = true;

* problem: matcher.findIdMatch() is lenient - returns a sequence

287

* with a dbref to the search arg e.g. ENST for ENSP - wrong

288

* but findInDataset() matches ENSP when looking for Uniprot...

289

290

SequenceI matchInDataset = findInDataset(xref);

291

if (matchInDataset != null && xref.getMap().getTo() != null

292

&& matchInDataset != xref.getMap().getTo())

293

{

294

System.err.println(

295

"Implementation problem (reopen JAL-2154): CrossRef.findInDataset seems to have recovered a different sequence than the one explicitly mapped for xref."

296

+ "Found:" + matchInDataset + "\nExpected:"

297

+ xref.getMap().getTo() + "\nFor xref:"

298

+ xref);

299

}

300

/*matcher.findIdMatch(mappedTo);*/

301

if (matchInDataset != null)

302

{

303

if (!rseqs.contains(matchInDataset))

304

{

305

rseqs.add(matchInDataset);

306

}

307

// even if rseqs contained matchInDataset - check mappings between

308

// these seqs are added

309

// need to try harder to only add unique mappings

310

if (xref.getMap().getMap().isTripletMap()

311

&& dataset.getMapping(seq, matchInDataset) == null

312

&& cf.getMappingBetween(seq, matchInDataset) == null)

313

{

314

// materialise a mapping for highlighting between these

// sequences

if (fromDna)

{

cf.addMap(dss, matchInDataset, xref.getMap().getMap(),

319

xref.getMap().getMappedFromId());

}

else

{

cf.addMap(matchInDataset, dss,

324

xref.getMap().getMap().getInverse(),

325

xref.getMap().getMappedFromId());

}

}

refIterator.remove();

330

continue;

331

}

332

// TODO: need to determine if this should be a deriveSequence

333

SequenceI rsq = new Sequence(mappedTo);

334

rseqs.add(rsq);

335

if (xref.getMap().getMap().isTripletMap())

336

{

337

// get sense of map correct for adding to product alignment.

338

if (fromDna)

339

{

340

// map is from dna seq to a protein product

341

cf.addMap(dss, rsq, xref.getMap().getMap(),

342

xref.getMap().getMappedFromId());

}

else

{

// map should be from protein seq to its coding dna

347

cf.addMap(rsq, dss, xref.getMap().getMap().getInverse(),

348

xref.getMap().getMappedFromId());

}

}

}

}

if (!found)

{

SequenceI matchedSeq = matcher.findIdMatch(

357

xref.getSource() + "|" + xref.getAccessionId());

358

// if there was a match, check it's at least the right type of

359

// molecule!

360

if (matchedSeq != null && matchedSeq.isProtein() == fromDna)

361

{

362

if (constructMapping(seq, matchedSeq, xref, cf, fromDna))

{

found = true;

}

}

}

if (!found)

{

// do a bit more work - search for sequences with references matching

372

// xrefs on this sequence.

373

found = searchDataset(fromDna, dss, xref, rseqs, cf, false);

}

if (found)

{

refIterator.remove();

}

}

* fetch from source database any dbrefs we haven't resolved up to here

383

384

if (!sourceRefs.isEmpty())

385

{

386

retrieveCrossRef(sourceRefs, seq, xrfs, fromDna, cf);

}

}

Alignment ral = null;

391

if (rseqs.size() > 0)

392

{

393

ral = new Alignment(rseqs.toArray(new SequenceI[rseqs.size()]));

394

if (!cf.isEmpty())

395

{

396

dataset.addCodonFrame(cf);

}

}

return ral;

}

private void retrieveCrossRef(List<DBRefEntry> sourceRefs, SequenceI seq,

403

DBRefEntry[] xrfs, boolean fromDna, AlignedCodonFrame cf)

404

{

405

ASequenceFetcher sftch = SequenceFetcherFactory.getSequenceFetcher();

406

SequenceI[] retrieved = null;

407

SequenceI dss = seq.getDatasetSequence() == null ? seq

408

: seq.getDatasetSequence();

409

// first filter in case we are retrieving crossrefs that have already been

410

// retrieved. this happens for cases where a database record doesn't yield

411

// protein products for CDS

412

removeAlreadyRetrievedSeqs(sourceRefs, fromDna);

413

if (sourceRefs.size() == 0)

414

{

415

// no more work to do! We already had all requested sequence records in

// the dataset.

return;

}

try

{

retrieved = sftch.getSequences(sourceRefs, !fromDna);

422

} catch (Exception e)

423

{

424

System.err.println(

425

"Problem whilst retrieving cross references for Sequence : "

+ seq.getName());

e.printStackTrace();

}

if (retrieved != null)

431

{

432

boolean addedXref = false;

433

List<SequenceI> newDsSeqs = new ArrayList<>(),

434

doNotAdd = new ArrayList<>();

435

436

for (SequenceI retrievedSequence : retrieved)

437

{

438

// dataset gets contaminated ccwith non-ds sequences. why ??!

439

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

440

SequenceI retrievedDss = retrievedSequence

441

.getDatasetSequence() == null ? retrievedSequence

442

: retrievedSequence.getDatasetSequence();

443

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

retrievedDss);

}

if (!addedXref)

{

// try again, after looking for matching IDs

449

// shouldn't need to do this unless the dbref mechanism has broken.

450

updateDbrefMappings(seq, xrfs, retrieved, cf, fromDna);

451

for (SequenceI retrievedSequence : retrieved)

452

{

453

// dataset gets contaminated ccwith non-ds sequences. why ??!

454

// try: Ensembl -> Nuc->Ensembl, Nuc->Uniprot-->Protein->EMBL->

455

SequenceI retrievedDss = retrievedSequence

456

.getDatasetSequence() == null ? retrievedSequence

457

: retrievedSequence.getDatasetSequence();

458

addedXref |= importCrossRefSeq(cf, newDsSeqs, doNotAdd, dss,

retrievedDss);

}

}

for (SequenceI newToSeq : newDsSeqs)

463

{

464

if (!doNotAdd.contains(newToSeq)

465

&& dataset.findIndex(newToSeq) == -1)

466

{

467

dataset.addSequence(newToSeq);

468

matcher.add(newToSeq);

}

}

}

}

/**

* Search dataset for sequences with a primary reference contained in

* sourceRefs.

* @param sourceRefs

* - list of references to filter.

480

* @param fromDna

481

* - type of sequence to search for matching primary reference.

482

483

private void removeAlreadyRetrievedSeqs(List<DBRefEntry> sourceRefs,

484

boolean fromDna)

485

{

486

DBRefEntry[] dbrSourceSet = sourceRefs.toArray(new DBRefEntry[0]);

487

for (SequenceI sq : dataset.getSequences())

488

{

489

boolean dupeFound = false;

490

// !fromDna means we are looking only for nucleotide sequences, not

491

// protein

492

if (sq.isProtein() == fromDna)

493

{

494

for (DBRefEntry dbr : sq.getPrimaryDBRefs())

495

{

496

for (DBRefEntry found : DBRefUtils.searchRefs(dbrSourceSet, dbr))

497

{

498

sourceRefs.remove(found);

dupeFound = true;

}

}

}

if (dupeFound)

{

// rebuild the search array from the filtered sourceRefs list

506

dbrSourceSet = sourceRefs.toArray(new DBRefEntry[0]);

}

}

}

/**

* process sequence retrieved via a dbref on source sequence to resolve and

* transfer data

* @param cf

* @param sourceSequence

517

* @param retrievedSequence

518

* @return true if retrieveSequence was imported

519

520

private boolean importCrossRefSeq(AlignedCodonFrame cf,

521

List<SequenceI> newDsSeqs, List<SequenceI> doNotAdd,

522

SequenceI sourceSequence, SequenceI retrievedSequence)

523

{

524

/**

525

* set when retrievedSequence has been verified as a crossreference for

526

* sourceSequence

527

528

boolean imported = false;

529

DBRefEntry[] dbr = retrievedSequence.getDBRefs();

530

if (dbr != null)

531

{

532

for (DBRefEntry dbref : dbr)

533

{

534

SequenceI matched = findInDataset(dbref);

535

if (matched == sourceSequence)

536

{

537

// verified retrieved and source sequence cross-reference each other

538

imported = true;

539

}

540

// find any entry where we should put in the sequence being

541

// cross-referenced into the map

542

Mapping map = dbref.getMap();

543

if (map != null)

544

{

545

if (map.getTo() != null && map.getMap() != null)

546

{

547

if (map.getTo() == sourceSequence)

548

{

549

// already called to import once, and most likely this sequence

550

// already imported !

continue;

}

if (matched == null)

{

* sequence is new to dataset, so save a reference so it can be added.

557

558

newDsSeqs.add(map.getTo());

continue;

}

* there was a matching sequence in dataset, so now, check to see if we can update the map.getTo() sequence to the existing one.

try

{

// compare ms with dss and replace with dss in mapping

569

// if map is congruent

570

SequenceI ms = map.getTo();

571

// TODO findInDataset requires exact sequence match but

572

// 'congruent' test is only for the mapped part

573

// maybe not a problem in practice since only ENA provide a

574

// mapping and it is to the full protein translation of CDS

575

// matcher.findIdMatch(map.getTo());

576

// TODO addendum: if matched is shorter than getTo, this will fail

577

// - when it should really succeed.

578

int sf = map.getMap().getToLowest();

579

int st = map.getMap().getToHighest();

580

SequenceI mappedrg = ms.getSubSequence(sf, st);

581

if (mappedrg.getLength() > 0 && ms.getSequenceAsString()

582

.equals(matched.getSequenceAsString()))

583

{

584

585

* sequences were a match,

586

587

String msg = "Mapping updated from " + ms.getName()

588

+ " to retrieved crossreference "

589

+ matched.getName();

590

System.out.println(msg);

591

592

DBRefEntry[] toRefs = map.getTo().getDBRefs();

if (toRefs != null)

{

* transfer database refs

597

598

for (DBRefEntry ref : toRefs)

599

{

600

if (dbref.getSrcAccString()

601

.equals(ref.getSrcAccString()))

602

{

603

continue; // avoid overwriting the ref on source sequence

604

}

605

matched.addDBRef(ref); // add or update mapping

606

}

607

}

608

doNotAdd.add(map.getTo());

map.setTo(matched);

* give the reverse reference the inverse mapping

613

* (if it doesn't have one already)

614

615

setReverseMapping(matched, dbref, cf);

616

617

618

* copy sequence features as well, avoiding

619

* duplication (e.g. same variation from two

620

* transcripts)

621

622

List<SequenceFeature> sfs = ms.getFeatures()

623

.getAllFeatures();

624

for (SequenceFeature feat : sfs)

625

{

626

627

* make a flyweight feature object which ignores Parent

628

* attribute in equality test; this avoids creating many

629

* otherwise duplicate exon features on genomic sequence

630

631

SequenceFeature newFeature = new SequenceFeature(feat)

632

{

633

@Override

634

public boolean equals(Object o)

635

{

636

return super.equals(o, true);

637

}

638

};

639

matched.addSequenceFeature(newFeature);

640

}

641

}

642

cf.addMap(retrievedSequence, map.getTo(), map.getMap());

643

} catch (Exception e)

644

{

645

System.err.println(

646

"Exception when consolidating Mapped sequence set...");

647

e.printStackTrace(System.err);

}

}

}

}

}

if (imported)

{

retrievedSequence.updatePDBIds();

656

rseqs.add(retrievedSequence);

657

if (dataset.findIndex(retrievedSequence) == -1)

658

{

659

dataset.addSequence(retrievedSequence);

660

matcher.add(retrievedSequence);

}

}

return imported;

}

/**

* Sets the inverse sequence mapping in the corresponding dbref of the mapped

668

* to sequence (if any). This is used after fetching a cross-referenced

669

* sequence, if the fetched sequence has a mapping to the original sequence,

670

* to set the mapping in the original sequence's dbref.

671

672

* @param mapFrom

673

* the sequence mapped from

* @param dbref

* @param mappings

void setReverseMapping(SequenceI mapFrom, DBRefEntry dbref,

678

AlignedCodonFrame mappings)

679

{

680

SequenceI mapTo = dbref.getMap().getTo();

if (mapTo == null)

{

return;

}

DBRefEntry[] dbrefs = mapTo.getDBRefs();

if (dbrefs == null)

{

return;

}

for (DBRefEntry toRef : dbrefs)

691

{

692

if (toRef.hasMap() && mapFrom == toRef.getMap().getTo())

693

{

694

695

* found the reverse dbref; update its mapping if null

696

697

if (toRef.getMap().getMap() == null)

698

{

699

MapList inverse = dbref.getMap().getMap().getInverse();

700

toRef.getMap().setMap(inverse);

701

mappings.addMap(mapTo, mapFrom, inverse);

}

}

}

}

/**

* Returns null or the first sequence in the dataset which is identical to

709

* xref.mapTo, and has a) a primary dbref matching xref, or if none found, the

710

* first one with an ID source|xrefacc

711

712

* @param xref

713

* with map and mapped-to sequence

714

* @return

715

716

SequenceI findInDataset(DBRefEntry xref)

717

{

718

if (xref == null || !xref.hasMap() || xref.getMap().getTo() == null)

{

return null;

}

SequenceI mapsTo = xref.getMap().getTo();

723

String name = xref.getAccessionId();

724

String name2 = xref.getSource() + "|" + name;

725

SequenceI dss = mapsTo.getDatasetSequence() == null ? mapsTo

726

: mapsTo.getDatasetSequence();

727

// first check ds if ds is directly referenced

728

if (dataset.findIndex(dss) > -1)

{

return dss;

}

DBRefEntry template = new DBRefEntry(xref.getSource(), null,

733

xref.getAccessionId());

734

/**

735

* remember the first ID match - in case we don't find a match to template

736

737

SequenceI firstIdMatch = null;

738

for (SequenceI seq : dataset.getSequences())

739

{

740

// first check primary refs.

741

List<DBRefEntry> match = DBRefUtils.searchRefs(

742

seq.getPrimaryDBRefs().toArray(new DBRefEntry[0]), template);

743

if (match != null && match.size() == 1 && sameSequence(seq, dss))

{

return seq;

}

* clumsy alternative to using SequenceIdMatcher which currently

749

* returns sequences with a dbref to the matched accession id

750

* which we don't want

751

752

if (firstIdMatch == null && (name.equals(seq.getName())

753

|| seq.getName().startsWith(name2)))

754

{

755

if (sameSequence(seq, dss))

{

firstIdMatch = seq;

}

}

}

return firstIdMatch;

}

/**

* Answers true if seq1 and seq2 contain exactly the same characters (ignoring

766

* case), else false. This method compares the lengths, then each character in

767

* turn, in order to 'fail fast'. For case-sensitive comparison, it would be

768

* possible to use Arrays.equals(seq1.getSequence(), seq2.getSequence()).

* @param seq1

* @param seq2

* @return

// TODO move to Sequence / SequenceI

775

static boolean sameSequence(SequenceI seq1, SequenceI seq2)

{

if (seq1 == seq2)

{

return true;

}

if (seq1 == null || seq2 == null)

{

return false;

}

if (seq1.getLength() != seq2.getLength())

{

return false;

}

int length = seq1.getLength();

791

for (int i = 0; i < length; i++)

792

{

793

int diff = seq1.getCharAt(i) - seq2.getCharAt(i);

794

795

* same char or differ in case only ('a'-'A' == 32)

796

797

if (diff != 0 && diff != 32 && diff != -32)

{

return false;

}

}

return true;

}

/**

* Updates any empty mappings in the cross-references with one to a compatible

807

* retrieved sequence if found, and adds any new mappings to the

* AlignedCodonFrame

* @param mapFrom

* @param xrefs

* @param retrieved

* @param acf

void updateDbrefMappings(SequenceI mapFrom, DBRefEntry[] xrefs,

816

SequenceI[] retrieved, AlignedCodonFrame acf, boolean fromDna)

817

{

818

SequenceIdMatcher idMatcher = new SequenceIdMatcher(retrieved);

819

for (DBRefEntry xref : xrefs)

{

if (!xref.hasMap())

{

String targetSeqName = xref.getSource() + "|"

824

+ xref.getAccessionId();

825

SequenceI[] matches = idMatcher.findAllIdMatches(targetSeqName);

if (matches == null)

{

return;

}

for (SequenceI seq : matches)

831

{

832

constructMapping(mapFrom, seq, xref, acf, fromDna);

}

}

}

}

/**

* Tries to make a mapping between sequences. If successful, adds the mapping

840

* to the dbref and the mappings collection and answers true, otherwise

841

* answers false. The following methods of making are mapping are tried in

842

* turn:

843

* <ul>

844

* <li>if 'mapTo' holds a mapping to 'mapFrom', take the inverse; this is, for

845

* example, the case after fetching EMBL cross-references for a Uniprot

846

* sequence</li>

847

* <li>else check if the dna translates exactly to the protein (give or take

848

* start and stop codons></li>

849

* <li>else try to map based on CDS features on the dna sequence</li>

* </ul>

* @param mapFrom

* @param mapTo

* @param xref

* @param mappings

* @return

boolean constructMapping(SequenceI mapFrom, SequenceI mapTo,

859

DBRefEntry xref, AlignedCodonFrame mappings, boolean fromDna)

860

{

861

MapList mapping = null;

862

SequenceI dsmapFrom = mapFrom.getDatasetSequence() == null ? mapFrom

863

: mapFrom.getDatasetSequence();

864

SequenceI dsmapTo = mapTo.getDatasetSequence() == null ? mapTo

865

: mapTo.getDatasetSequence();

866

867

* look for a reverse mapping, if found make its inverse.

868

* Note - we do this on dataset sequences only.

869

870

if (dsmapTo.getDBRefs() != null)

871

{

872

for (DBRefEntry dbref : dsmapTo.getDBRefs())

873

{

874

String name = dbref.getSource() + "|" + dbref.getAccessionId();

875

if (dbref.hasMap() && dsmapFrom.getName().startsWith(name))

876

{

877

878

* looks like we've found a map from 'mapTo' to 'mapFrom'

879

* - invert it to make the mapping the other way

880

881

MapList reverse = dbref.getMap().getMap().getInverse();

882

xref.setMap(new Mapping(dsmapTo, reverse));

883

mappings.addMap(mapFrom, dsmapTo, reverse);

return true;

}

}

}

if (fromDna)

{

mapping = AlignmentUtils.mapCdnaToProtein(mapTo, mapFrom);

}

else

{

mapping = AlignmentUtils.mapCdnaToProtein(mapFrom, mapTo);

896

if (mapping != null)

897

{

898

mapping = mapping.getInverse();

}

}

if (mapping == null)

{

return false;

}

xref.setMap(new Mapping(mapTo, mapping));

906

907

908

* and add a reverse DbRef with the inverse mapping

909

910

if (mapFrom.getDatasetSequence() != null && false)

911

// && mapFrom.getDatasetSequence().getSourceDBRef() != null)

912

{

913

// possible need to search primary references... except, why doesn't xref

914

// == getSourceDBRef ??

915

// DBRefEntry dbref = new DBRefEntry(mapFrom.getDatasetSequence()

916

// .getSourceDBRef());

917

// dbref.setMap(new Mapping(mapFrom.getDatasetSequence(), mapping

918

// .getInverse()));

919

// mapTo.addDBRef(dbref);

}

if (fromDna)

{

AlignmentUtils.computeProteinFeatures(mapFrom, mapTo, mapping);

925

mappings.addMap(mapFrom, mapTo, mapping);

}

else

{

mappings.addMap(mapTo, mapFrom, mapping.getInverse());

}

return true;

}

/**

* find references to lrfs in the cross-reference set of each sequence in

937

* dataset (that is not equal to sequenceI) Identifies matching DBRefEntry

938

* based on source and accession string only - Map and Version are nulled.

939

940

* @param fromDna

941

* - true if context was searching from Dna sequences, false if

942

* context was searching from Protein sequences

* @param sequenceI

* @param lrfs

* @param foundSeqs

* @return true if matches were found.

947

948

4235

private boolean searchDatasetXrefs(boolean fromDna, SequenceI sequenceI,

949

DBRefEntry[] lrfs, List<SequenceI> foundSeqs,

950

AlignedCodonFrame cf)

951

{

952

4235

boolean found = false;

953

4235

if (lrfs == null)

954

{

955

1735

return false;

956

}

957

5001

for (int i = 0; i < lrfs.length; i++)

958

{

959

2501

DBRefEntry xref = new DBRefEntry(lrfs[i]);

960

// add in wildcards

961

2501

xref.setVersion(null);

962

2501

xref.setMap(null);

963

2501

found |= searchDataset(fromDna, sequenceI, xref, foundSeqs, cf,

964

false);

965

}

966

2500

return found;

}

/**

* Searches dataset for DBRefEntrys matching the given one (xrf) and adds the

971

* associated sequence to rseqs

972

973

* @param fromDna

974

* true if context was searching for refs *from* dna sequence, false

975

* if context was searching for refs *from* protein sequence

976

* @param fromSeq

977

* a sequence to ignore (start point of search)

978

* @param xrf

979

* a cross-reference to try to match

980

* @param foundSeqs

981

* result list to add to

982

* @param mappings

983

* a set of sequence mappings to add to

984

* @param direct

985

* - indicates the type of relationship between returned sequences,

986

* xrf, and sequenceI that is required.

987

* <ul>

988

* <li>direct implies xrf is a primary reference for sequenceI AND

989

* the sequences to be located (eg a uniprot ID for a protein

990

* sequence, and a uniprot ref on a transcript sequence).</li>

991

* <li>indirect means xrf is a cross reference with respect to

992

* sequenceI or all the returned sequences (eg a genomic reference

993

* associated with a locus and one or more transcripts)</li>

994

* </ul>

995

* @return true if relationship found and sequence added.

996

997

2515

boolean searchDataset(boolean fromDna, SequenceI fromSeq, DBRefEntry xrf,

998

List<SequenceI> foundSeqs, AlignedCodonFrame mappings,

999

boolean direct)

1000

{

1001

2515

boolean found = false;

1002

2515

if (dataset == null)

{

return false;

}

2515

if (dataset.getSequences() == null)

1007

{

1008

System.err.println("Empty dataset sequence set - NO VECTOR");

1009

return false;

1010

}

1011

2515

List<SequenceI> ds = dataset.getSequences();

1012

2515

synchronized (ds)

1013

{

1014

2515

for (SequenceI nxt : ds)

1015

{

1016

45449

if (nxt != null)

1017

{

1018

45449

if (nxt.getDatasetSequence() != null)

1019

{

1020

System.err.println(

1021

"Implementation warning: CrossRef initialised with a dataset alignment with non-dataset sequences in it! ("

1022

+ nxt.getDisplayId(true) + " has ds reference "

1023

+ nxt.getDatasetSequence().getDisplayId(true)

1024

+ ")");

1025

}

1026

45449

if (nxt == fromSeq || nxt == fromSeq.getDatasetSequence())

1027

{

1028

2512

continue;

1029

}

1030

1031

* only look at same molecule type if 'direct', or

1032

* complementary type if !direct

1033

1034

{

1035

42937

boolean isDna = !nxt.isProtein();

1036

42937

if (direct ? (isDna != fromDna) : (isDna == fromDna))

1037

{

1038

// skip this sequence because it is wrong molecule type

1039

42930

continue;

}

}

// look for direct or indirect references in common

1044

DBRefEntry[] poss = nxt.getDBRefs();

1045

List<DBRefEntry> cands = null;

1046

1047

// todo: indirect specifies we select either direct references to nxt

1048

// that match xrf which is indirect to sequenceI, or indirect

1049

// references to nxt that match xrf which is direct to sequenceI

1050

cands = DBRefUtils.searchRefs(poss, xrf);

1051

// else

1052

// {

1053

// poss = DBRefUtils.selectDbRefs(nxt.isProtein()!fromDna, poss);

1054

// cands = DBRefUtils.searchRefs(poss, xrf);

1055

// }

1056

if (!cands.isEmpty())

1057

{

1058

if (foundSeqs.contains(nxt))

{

continue;

}

found = true;

foundSeqs.add(nxt);

if (mappings != null && !direct)

1065

{

1066

1067

* if the matched sequence has mapped dbrefs to

1068

* protein product / cdna, add equivalent mappings to

1069

* our source sequence

1070

1071

for (DBRefEntry candidate : cands)

1072

{

1073

Mapping mapping = candidate.getMap();

1074

if (mapping != null)

1075

{

1076

MapList map = mapping.getMap();

1077

if (mapping.getTo() != null

1078

&& map.getFromRatio() != map.getToRatio())

1079

{

1080

1081

* add a mapping, as from dna to peptide sequence

1082

1083

if (map.getFromRatio() == 3)

1084

{

1085

mappings.addMap(nxt, fromSeq, map);

}

else

{

mappings.addMap(nxt, fromSeq, map.getInverse());

}

}

}

}

}

}

}

}

}

2515

return found;

1100

}

1101

}

jalviewX

File CrossRef.java

Coverage histogram

Code metrics

Classes

Class CrossRef

Contributing tests

Contributing tests

Source view